Анализ и извлечение ключевых фраз из текстов с использованием SpaCy

Иван Сергеевич Андриенко

Аннотация


В данной статье описан процесс разработки инструмента для автоматического анализа и извлечения ключевых фраз из текстов с использованием библиотеки SpaCy на языке программирования python. Рассмотрены ключевые аспекты работы с текстовыми данными, включая предобработку текста, извлечение именных групп и фильтрацию по значимости. В качестве примера приведена реализация программы для анализа текстов на русском языке, которая извлекает ключевые фразы, основываясь на синтаксическом разборе текста. Показано, как с помощью SpaCy можно эффективно анализировать текстовые данные и выделять ключевые понятия.


Полный текст:

PDF

Ссылки

  • На текущий момент ссылки отсутствуют.


ISSN 2414-4487