Метод оценки степени связанности профилей пользователей социальной сети на основе открытых данных


https://doi.org/10.21686/1818-4243-2017-6-14-22

Полный текст:


Аннотация

Целью исследования являлось изучение существующих методов определения степени связанности двух пользователей социальной сети, определение их недостатков и разработка нового метода. В ходе исследования были выявлены недостатки существующих методов и предложен новый метод оценки степени связанности профилей социальной сети на основе открытых данных из социальной сети. Под степенью связанности профилей пользователей понимается вероятность связи (взаимодействия) владельцев профилей в реальной жизни, она рассчитывается для двух пользователей социальной сети и выражается в процентах. Работа метода демонстрируется на примере социальной сети «Вконтакте». Данный метод включает в себя последовательность следующих этапов: на первом этапе происходит сбор данных о пользователях социальной сети с помощью API и формирование кортежей признаков профилей пользователей. Кортеж признаков профилей социальной сети – это собранные для каждого из пользователей данные, хранящиеся в структурированном виде. Следующий этап – анализ собранной информации. Для каждого признака из кортежа профилей, т.е. возможного элемента взаимодействия пользователей в социальной сети, рассчитывается коэффициент связанности по признаку. Также для каждого признака рассчитывается его информативность, т.е. на сколько важен тот или иной признак в данной социальной сети. На заключительной этапе происходит формирование результатов с помощью выведенной в процессе исследования формулы вероятности связи двух пользователей. Полученная в результате применения метода вероятность связи двух пользователей может применяться для оптимизации деятельности оперативно-розыскных служб и специальных органов. Также полученная степень связанности двух пользователей может интерпретироваться как вероятность возникновения канала утечки информации между ними. В роли пользователя метода может выступать любая частная или государственная организация, заботящаяся о безопасности корпоративных данных и коммерческой тайне, оперативно-розыскная служба, а также организация, исследующая кибер-преступления и инциденты информационной безопасности. 


Об авторах

в А. Катаева
Университет ИТМО, Санкт-Петербург
Россия
Магистрант


И. С. Пантюхин
Университет ИТМО, Санкт-Петербург
Россия

Ассистент 



И. В. Юрин
Университет ИТМО, Санкт-Петербург
Россия

К.воен.н., доцент



Список литературы

1. Алексеев В.Е., Теория графов. Электронное учебно-методическое пособие. Нижний Новгород: ННГУ им. Лобачевского, 2012. 60 с.

2. Бессонова Е.Е., Метод идентификации пользователей в сети Интернет с использованием компонентного профиля // Материал диссертационной работы на соискание ученой степени кандидата технических наук. Санкт- Петербург, 2014. 115 с.

3. Голованова И.С., Выбор информативных признаков. Оценка информативности // Методические указания к лабораторной работе по дисциплине «Методы обработки биомедицинских данных». Томск, ТПУ. 2003. 18 с.

4. Тарасов В.Н., Экспоненциальный закон распределения. Математическая теория надежности. Учебно-методический комплекс по дисциплине «Математическая теория надежности». Самара, ПГУТИ. 2012. 204 с.

5. Каналы утечки информации. Википедия: свободная энциклопедия / URL: https:// ru.wikipedia.org/wiki/Каналы_утечки_информации (дата обращения: 11.04.2016)

6. Проверка статистических гипотез. Профессиональный информационно-аналитический ресурс, посвященный машинному обучению, рас- познаванию образов и интеллектуальному анализ данных / URL: http://www.machinelearning.ru/ wiki/index.php?title=Проверка_статистических_ гипотез# (дата обращения: 20.04.2016)

7. Социальная сеть. Википедия: свободная энциклопедия / URL: https://ru.wikipedia.org/wiki/ Социальная_сеть (дата обращения: 17.03.2016).

8. Утечка корпоративных данных через социальные сети. Пресс-центр компании Serchinform / URL: http://searchinform.ru/press/articles/777/ (дата обращения 20.04.2016)

9. Базовая модель угроз безопасности персональных данных при их обработке в информационных системах персональных данных (вы- писка) // Федеральная служба по техническому и экспортному контролю. М.: 2008. 69 с.

10. Mislove A., Measurement and Analysis of Online Social Networks / Alan Mislove, Massimiliano Marcon, Krishna P. Gummadi // Proceedings of the 5th ACM/USENIX Internet Measurement Conference. 2007. P. 29–42.

11. William H. Hsu, Structural Link Analysis from User Profiles and Friends Networks: A Feature Construction Approach / William H. Hsu, Joseph Lancaster, Martin S.R. Paradesi, Tim Weninger // International Conference on Weblogs and Social Media. 2007.

12. Пантюхин И.С., Зикратов И.А. Методика проведения постинцидентного внутреннего аудита средств вычислительной техники // Научно-технический вестник информационных технологий, механики и оптики. 2017. Т. 17. № 3. С. 467–474. doi: 10.17586/2226-1494-2017- 17-3-467-474

13. Пантюхин И.С., Зикратов И.А., Левина А.Б. Метод проведения постинцидентного внутреннего аудита средств вычислительной техники на основе графов // Научно-технический вестник информационных технологий, механики и оптики. 2016. Т. 16. № 3. С. 506–512. doi: 10.17586/2226-1494-2016-16-3-506-512

14. Юрасов Д.С., Зикратов И.А. Различение пользователей на основе их поведения в сети Интернет // Научно-технический вестник информационных технологий, механики и оптики. 2013. № 6 (88). С. 148–151.

15. Бессонова Е.Е., Зикратов И.А., Рос- ков В.Ю. Анализ способов идентификации пользователей в сети Интернет // Научно-технический вестник информационных технологий, механики и оптики. 2012. № 6 (82). С. 128–130.

16. Воробьева А.А. Методика идентификации интернет-пользователя на основе стилистических и лингвистических характеристик коротких электронных сообщений // Информация и космос. 2017. № 1. С. 127–130.

17. Воробьева А.А. Анализ возможности применения различных лингвистических характеристик для идентификации автора анонимных коротких сообщений в глобальной сети Интернет // Информация и космос. 2014. № 1. С. 42–46.

18. В.В. Быкова, А.В. Катаева Методы и средства анализа информативности признаков при обработке медицинских данных // Программные продукты и системы. 2016. № 2 (114). С. 172–178.

19. Shannon, C.E. The Mathematical Theory of Communication / C.E.Shannon and W.Weaver. Urbana, IL: University of Illinois Press. ISBN: 0252725484. 1963. 144 p.

20. Глазкова А.В., Математическое моделирование классификации объектов (на примере определения категории поненциальных адресатов текста) // Материал диссертационной работы на соискание ученой степени кандидата технических наук. Тюмень. 2016. 141 с.


Дополнительные файлы

Для цитирования: Катаева в.А., Пантюхин И.С., Юрин И.В. Метод оценки степени связанности профилей пользователей социальной сети на основе открытых данных. Открытое образование. 2017;(6):14-22. https://doi.org/10.21686/1818-4243-2017-6-14-22

For citation: Kataeva V.A., Pantyukhin I.S., Yurin I.V. Estimation method of the cohesion degree for the users’ profiles of social network based on open data. Open Education. 2017;(6):14-22. (In Russ.) https://doi.org/10.21686/1818-4243-2017-6-14-22

Просмотров: 176

Обратные ссылки

  • Обратные ссылки не определены.


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1818-4243 (Print)
ISSN 2079-5939 (Online)