1 В избранное 0 Ответвления 0

OSCHINA-MIRROR/apple12345656-tf-idf-keyword

Присоединиться к Gitlife
Откройте для себя и примите участие в публичных проектах с открытым исходным кодом с участием более 10 миллионов разработчиков. Приватные репозитории также полностью бесплатны :)
Присоединиться бесплатно
Клонировать/Скачать
segmenter.py 342 Байты
Копировать Редактировать Web IDE Исходные данные Просмотреть построчно История
gaussic Отправлено 01.11.2017 19:37 7b80dbd
#!/usr/bin/python
# -*- coding: utf-8 -*-
import jieba
import re
def segment(sentence, cut_all=False):
sentence = sentence.replace('\n', '').replace('\u3000', '').replace('\u00A0', '')
sentence = ' '.join(jieba.cut(sentence, cut_all=cut_all))
return re.sub('[a-zA-Z0-9.。::,,))((!!??”“\"]', '', sentence).split()

Опубликовать ( 0 )

Вы можете оставить комментарий после Вход в систему

1
https://api.gitlife.ru/oschina-mirror/apple12345656-tf-idf-keyword.git
git@api.gitlife.ru:oschina-mirror/apple12345656-tf-idf-keyword.git
oschina-mirror
apple12345656-tf-idf-keyword
apple12345656-tf-idf-keyword
master