К основному контенту

Sentiment-анализ и кластерный анализ

 Sentiment-анализ

Текст №1 - Статья из Яндекс. Дзен "Мост через Гибралтар. Почему его до сих пор не построили"


Текст №2 - Статья из Яндекс. Дзен "Вымирающий город в который нет дорог как я съездил в Воркуту"

Данные мною две статьи совершенно разных тематик и направленности. Первая - информационная, вторая - экспрессивная по подаче. Исходя из этого анализ второго текста показывает доминирующий эмоциональный посыл текста, что логично и естественно для него. И несмотря на приятную визуальную составляющую модели DMS, для меня более понятна, лаконична, проста модель feature statistics в привычной диаграмме. Хотя по первой модели не менее сложно определить необходимые данные и провести анализ. Но именно вторая модель дает наиболее точную оценку, по крайней мере по своей подаче и показе статистики.

Кластерный анализ

Я взяла 10 статей схожей темы по ключевому слову "СМИ" 












Выбранные мною тексты разделились на следующие группы:

1. Политическое манипулирование в СМИ

2. Влияние СМИ на формирование общества

3. Воздействие СМИ

4. Роль СМИ в политическом сознании

5. Роль СМИ в современной России

6. Доверие населения к власти в СМИ

7. Десять трендов новых медиа

8. Становление и развитие отечественного СМИ

9. Влияние СМИ на формирование культурного наследия

10. Особенности аутоагрессивного поведения 

Мое обоснование просто - пусть и статьи объединены общей тематикой и направленностью в виде предмета изучения СМИ, но сами темы статей и их направления изучения, в рамках обширного предмета изучения, локальны и имеют свои ветви дальнейшего развития. Поэтому 10 статей разделились на 10 групп, а там и до подгрупп недалеко. А потом ещё глядишь что выйдет.

Комментарии