Preview

Научно-технический вестник информационных технологий, механики и оптики

Расширенный поиск

Применение волновой модели текста к задаче сентимент-анализа

https://doi.org/10.17586/2226-1494-2022-22-6-1159-1165

Аннотация

Предмет исследования. Исследована волновая модель представления коротких текстов на русском языке. Модель является одной из реализаций дистрибутивной семантики. В модели учтены не только частоты встречаемости слов в тексте, но и их взаимное влияние. Итогом реализации модели служит повышение точности анализа тональности коротких текстов.

Метод. Основу определения взаимосвязей между текстом и термином составляет расчет амплитуды вероятности близости текста к термину с использованием волновой модели. Термин, обладающий наибольшей амплитудой вероятности, считается наиболее точно соответствующим смыслу текста. Волновая модель позволяет учесть тот факт, что известные методы определяют антонимы как семантически близкие лексические единицы.

Основные результаты. Для экспериментального исследования предложенного метода выбрано решение задачи сентимент-анализа, то есть нахождения соответствия отзывов пользователей о покупках на маркетплейсе классам «позитивный» и «негативный». В результате эксперимента получена точность оценки тональности текста до 76,4 %, что превышает точность классического подхода, а также известных методик сентимент-анализа для русского языка. Выявлено значительное влияние таких параметров модели, как выбор базисной дистрибутивно-семантической модели, выбор контрольной точки для расчета волновых чисел, учет влияния антонимов на точность классификации. Представленная модель показала высокую точность в выявлении взаимосвязей текста с не присутствующими в нем явно понятиями.

Практическая значимость. Предложенный метод может успешно применяться как математическая основа решения задач сентимент-анализа. Полученные результаты показали потенциальные возможности использования волновой модели в областях, требующих классификации текстов по косвенным признакам, например, для определения элементов психологического портрета автора.

Об авторах

А. С. Груздева
Университет ИТМО
Россия

Груздева Анастасия Сергеевна – аспирант

Санкт-Петербург, 197101

sc 57674037100



Р. Н. Юрьев
Университет ИТМО
Россия

Юрьев Родион Николаевич – аспирант

Санкт-Петербург, 197101

sc 57485730300



И. А. Бессмертный
Университет ИТМО
Россия

Бессмертный Игорь Александрович – доктор технических наук, профессор

Санкт-Петербург, 197101

sc 36661767800



Список литературы

1. Garg N., Sharma K. Text pre-processing of multilingual for sentiment analysis based on social network data // International Journal of Electrical and Computer Engineering. 2022. V. 12. N 1. P. 776–784. https://doi.org/10.11591/ijece.v12i1.pp776-784

2. Корней А.О., Крючкова Е.Н. Проблемы эффективности сентимент-анализа русскоязычных текстов в социальных сетях // Высокопроизводительные вычислительные системы и технологии. 2018. Т. 2. № 2. С. 87–92.

3. Пазельская А.Г., Соловьев А.Н. Метод определения эмоций в текстах на русском языке // Тезисы докладов Международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2011». М.: РГГУ, 2011. С. 510–522.

4. Клековкина М.В., Котельников Е.В. Метод автоматической классификации текстов по тональности, основанный на словаре эмоциональной лексики // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: материалы XIV Всероссийской научной конференции (RCDL-2012). 2012. С. 118–123.

5. Бессмертный И.А., Джалиашвили З.О., Максимов В.В., Маркин Д.А. Лингвооценочное управление текстом // Тезисы докладов X Международной конференции «Применение новых технологий в образовании». Троицк: Фонд новых технологий в образовании «Байтик», 1999.

6. Harris Z. Mathematical Structures of Language. Wiley, 1968. 230 p.

7. Богданов А.Л., Дуля И.С. Сентимент-анализ коротких русскоязычных текстов в социальных медиа // Вестник Томского государственного университета. Экономика. 2019. № 47. С. 220–241. https://doi.org/10.17223/19988648/47/17

8. Рябыкин А.С., Сухов Е.А. Нейросетевые методы в задаче сентимент-анализа // DSPA. 2022. Т. 2. № 2. С. 41–57.

9. Воробьев А.А., Рыбак А.М., Середкин Р.А., Андросов А.Ю., Соловьев Б.И. Методика сбора и обработки социологической информации из сети Интернет // Известия Тульского государственного университета. Технические науки. 2022. № 2. С. 208–213. https://doi.org/10.24412/2071-6168-2022-2-208-214

10. Фомина И.К., Татаурова А.С. Повышение эффективности модели классификации определения тональности текста // Актуальные проблемы экономики и управления. 2022. № 1. С. 55–58.

11. Zuccon G., Azzopardi L., van Rijsbergen K. The quantum probability ranking principle for information retrieval // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). 2009. V. 5766. P. 232–240. https://doi.org/10.1007/978-3-642-04417-5_21

12. Melucci M. Introduction to Information Retrieval and Quantum Mechanics. Springer-Verlag Berlin Heidelberg, 2015. 247 р. https://doi.org/10.1007/978-3-662-48313-8

13. Хренников А.Ю. Введение в квантовую теорию информации. М.: Физматлит, 2008. 283 с.

14. Blacoe W., Kashefi E., Lapata M. A quantum-theoretic approach to distributional semantics // Proc. of the 2013 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL HLT). 2013. P. 847–857.

15. Jaiswal A.K., Holdack G., Frommholz I., Liu H. Quantum-like Generalization of Complex Word Embedding: a lightweight approach for textual classification // CEUR Workshop Proceedings. 2018. V. 2191. P. 159–168.

16. Surov I.A., Semenenko E., Platonov A.V., Bessmertny I.A., Galofaro F., Toffano Z., Khrennikov A.Yu., Alodjants A.P. Quantum semantics of text perception // Scientific Reports. 2021. V. 11. N 1. P. 4193. https://doi.org/10.1038/s41598-021-83490-9

17. Груздева А.С., Бессмертный И.А. Классификация коротких текстов с использованием волновой модели // Научно-технический вестник информационных технологий, механики и оптики. 2022. Т. 22. № 2. С. 287–293. https://doi.org/10.17586/2226-1494-2022-22-2-287-293

18. Френкель Я.И. Волновая механика. Ч. 1. Элементарная теория. Квантовая физика. М., 2019. 386 с.

19. Kutuzov A., Kuzmenko E. Webvectors: A toolkit for building web interfaces for vector semantic models // Communications in Computer and Information Science. 2017. V. 661. P. 155–161. https://doi.org/10.1007/978-3-319-52920-2_15

20. Panchenko A., Ustalov D., Arefyev N., Paperno D., Konstantinova N., Loukachevitch N., Biemann C. Human and machine judgements about russian semantic relatedness // Communications in Computerand Information Science. 2016. V. 661. P. 221–235. https://doi.org/10.1007/978-3-319-52920-2_21

21. Pang B., Lee L. A sentimental education: Sentiment analysis using subjectivity summarization based on minimum cuts // Proc. of the 42nd Annual Meeting Association for Computational Linguistics (ACL). 2004. P. 271–278. https://doi.org/10.3115/1218955.1218990

22. Меньшиков И.Л. Анализ тональности текста на русском языке при помощи графовых моделей // Доклады всероссийской научной конференции АИСТʼ2013 «Анализ Изображений, Сетей и Текстов». Екатеринбург, 2013. C. 151–155.

23. González F.A., Caicedo J.C. Quantum latent semantic analysis // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). 2011. V. 6931. P. 52–63. https://doi.org/10.1007/978-3-642-23318-0_7

24. Dalla Chiara M.L., Giuntini R., Luciani A.R., Negri E. A quantumlike semantic analysis of ambiguity in music // Soft Computing. 2017. V. 21. N 6. P. 1473–1481. https://doi.org/10.1007/s00500-015-1895-y


Рецензия

Для цитирования:


Груздева А.С., Юрьев Р.Н., Бессмертный И.А. Применение волновой модели текста к задаче сентимент-анализа. Научно-технический вестник информационных технологий, механики и оптики. 2022;22(6):1159-1165. https://doi.org/10.17586/2226-1494-2022-22-6-1159-1165

For citation:


Gruzdeva A.S., Iurev R.N., Bessmertny I.A. Application of the text wave model to the sentiment analysis problem. Scientific and Technical Journal of Information Technologies, Mechanics and Optics. 2022;22(6):1159-1165. (In Russ.) https://doi.org/10.17586/2226-1494-2022-22-6-1159-1165

Просмотров: 2


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2226-1494 (Print)
ISSN 2500-0373 (Online)