Preview

Научно-технический вестник информационных технологий, механики и оптики

Расширенный поиск

Эмоциональный анализ данных социальных сетей с использованием кластерной вероятностной нейронной сети с параллелизмом данных

https://doi.org/10.17586/2226-1494-2023-23-6-1143-1151

Аннотация

Социальные сети содержат огромное количество данных, которые используются различными организациями для изучения эмоций, мыслей и мнений людей. Пользователи часто используют смайлы и эмодзи в дополнение к словам, чтобы выразить свое мнение по обсуждаемой теме. Идентификация эмоций в тексте также требует изучения, однако исследования в этой области все еще находятся в начальном состоянии. Сегодня доступно недостаточно наборов данных с аннотациями интенсивностей эмоций. Сложность задачи аннотирования эмоций и дальнейшие комментарии пользователей становятся проблемами при разработке новых наборов данных. Для решения этих проблем выполняются многочисленные исследования. Разработанные методы не смогли осуществить классификацию эмоций простым и экономичным способом. В настоящей работе представлена модель эффективной классификации эмоций в записях на основе кластеризации. Набор данных записей в социальных сетях предварительно обработан для удаления нежелательных элементов и далее кластеризован. С целью повышения эффективности классификации выбраны семантические и эмоциональные признаки. Для сокращения времени вычислений и повышения эффективности системы прогнозирования вероятности эмоций предложена концепция параллелизма данных в классификаторе. Предложенная модель апробирована с использованием программного обеспечения MATLAB. В результате модель обеспечила точности для аннотированного набора данных — 92 %, а для WASSA-2017 – 94 %. Выполнен анализ производительности описанной модели с существующими методами, такими как Parallel K-Nearest Neighboring и Parallel Naive Byes Model. Результаты сравнения показали, что предложенная модель наиболее эффективно предсказывает эмоции по сравнению с существующими.

Об авторах

С. Джини Старлин
Индуистский колледж Южного Траванкора
Индия

Старлин Джини С. — исследователь

Нагеркойл, 629002

sc 57214932690



Н. Индра Ченталир
Индуистский колледж Южного Траванкора
Индия

Ченталир Индра Н. — руководитель, доцент

Нагеркойл, 629002

sc 55803553600



Список литературы

1. Lee N., Ajanthan T., Torr P.H., Jaggi M. Understanding the effects of data parallelism and sparsity on neural network training // arXiv. 2021. arXiv:2003.11316. https://doi.org/10.48550/arXiv.2003.11316

2. Xun Y., Zhang J., Qin X., Zhao X. FiDoop-DP: Data partitioning in frequent itemset mining on hadoop clusters // IEEE Transactions on Parallel and Distributed Systems. 2017. V. 28. N 1. P. 101–114. https://doi.org/10.1109/tpds.2016.2560176

3. Kulkarni M., Pingali K., Ramanarayanan G., Walter B., Bala K., Chew L.P. Optimistic parallelism benefits from data partitioning // ACM SIGPLAN Notices. 2008. V. 43. N 3. P. 233–243. https://doi.org/10.1145/1353536.1346311

4. Hernández Á.B., Perez M.S., Gupta S., Muntés-Mulero V. Using machine learning to optimize parallelism in big data applications // Future Generation Computer Systems. 2018. V. 86. P. 1076–1092. https://doi.org/10.1016/j.future.2017.07.003

5. Karthick S. Semi supervised hierarchy forest clustering and KNN based metric learning technique for machine learning system // Journal of Advanced Research in Dynamical and Control Systems. 2017. V. 9. P. 2679–2690.

6. Chatterjee A., Gupta U., Chinnakotla M.K., Srikanth R., Galley M., Agrawal P. Understanding emotions in text using deep learning and big data // Computers in Human Behavior. 2019. V. 93. P. 309–317. https://doi.org/10.1016/j.chb.2018.12.029

7. Marimuthu M., Rajalakshmi M., Phil M.C.A.M. A big data clustering algorithm for sentiment analysis to search the crucial statistics for decision making // International Journal for Research and Development in Technology (IJRDT). 2017. V. 7. N 2. P. 132–138.

8. Feng N., Xu S., Liang Y., Liu K. A probabilistic process neural network and its application in ECG classification // IEEE Access. 2019. V. 7. P. 50431–50439. https://doi.org/10.1109/access.2019.2910880

9. He Q., Zhuang F., Li J., Shi Z. Parallel implementation of classification algorithms based on MapReduce // Lecture Notes in Computer Science. 2010. V. 6401. P. 655–662. https://doi.org/10.1007/978-3-642-16248-0_89

10. Tang D., Wei F., Yang N., Zhou M., Liu T., Qin B. Learning sentiment-specific word embedding for twitter sentiment classification // Proc. of the 52nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). 2014. P. 1555– 1565. https://doi.org/10.3115/v1/p14-1146

11. Mahmoodabadi M.J. Epidemic model analyzed via particle swarm optimization based homotopy perturbation method // Informatics in Medicine Unlocked. 2020. V. 18. P. 100293. https://doi.org/10.1016/j.imu.2020.100293

12. Gupta V., Choudhary D., Tang P.T.P., Wei X., Wang X., Huang Y., Kejariwal A., Ramchandran K., Mahoney M.W. Training recommender systems at scale: Communication-efficient model and data parallelism // arXiv. 2020. arXiv:2010.08899. https://doi.org/10.48550/arXiv.2010.08899

13. Ye X., Zhao J., Chen Y., Guo L.J. Bayesian adversarial spectral clustering with unknown cluster number // IEEE Transactions on Image Processing. 2020. V. 29. P. 8506–8518. https://doi.org/10.1109/tip.2020.3016491

14. Schneider S., Hirzel M., Gedik B., Wu K.L. Safe data parallelism for general streaming // IEEE Transactions on Computers. 2015. V. 64. N 2. P. 504–517. https://doi.org/10.1109/tc.2013.221

15. Alguliyev R.M., Aliguliyev R.M., Sukhostat L.V. Efficient algorithm for big data clustering on single machine // CAAI Transactions on Intelligence Technology. 2020. V. 5. N 1. P. 9–14. https://doi.org/10.1049/trit.2019.0048

16. Kinra A., Beheshti-Kashi S., Buch R., Nielsen T.A.S., Pereira F. Examining the potential of textual big data analytics for public policy decision-making: A case study with driverless cars in Denmark // Transport Policy. 2020. V. 98. P. 68–78. https://doi.org/10.1016/j.tranpol.2020.05.026

17. Bolla S., Anandan R. Privacy preservation of data using efficient group cost optimization method with big data clustering // International Journal of Advanced Research in Engineering and Technology (IJARET). 2020. V. 11. N 11. P. 748–760. https://doi.org/10.34218/IJARET.11.11.2020.071

18. Fan W., Bouguila N. Spherical data clustering and feature selection through nonparametric Bayesian mixture models with von Mises distributions // Engineering Applications of Artificial Intelligence. 2 0 2 0 . V. 94. P. 103781. https://doi.org/10.1016/j.engappai.2020.103781

19. Alotaibi N., Al-onazi B.B., Nour M.K., Mohamed A., Motwakel A., Mohammed G.P., Yaseen I., Rizwanullah M. Political optimizer with probabilistic neural network-based Arabic comparative opinion mining // Intelligent Automation & Soft Computing. 2023. V. 36. N 3. P. 3121–3137. https://doi.org/10.32604/iasc.2023.033915


Рецензия

Для цитирования:


Старлин С.Д., Ченталир Н.И. Эмоциональный анализ данных социальных сетей с использованием кластерной вероятностной нейронной сети с параллелизмом данных. Научно-технический вестник информационных технологий, механики и оптики. 2023;23(6):1143-1151. https://doi.org/10.17586/2226-1494-2023-23-6-1143-1151

For citation:


Starlin S.J., Chenthalir N.I. Emotion analysis of social network data using cluster based probabilistic neural network with data parallelism. Scientific and Technical Journal of Information Technologies, Mechanics and Optics. 2023;23(6):1143-1151. https://doi.org/10.17586/2226-1494-2023-23-6-1143-1151

Просмотров: 12


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2226-1494 (Print)
ISSN 2500-0373 (Online)