Preview

Известия Юго-Западного государственного университета

Расширенный поиск

ИНФОЛОГИЧЕСКАЯ СИСТЕМА АНАЛИТИЧЕСКОГО МОНИТОРИНГА ДАННЫХ В НЕСТРУКТУРИРОВАННЫХ ИНФОРМАЦИОННЫХ РЕСУРСАХ

https://doi.org/10.21869/2223-1560-2017-21-5-45-61

Аннотация

В работе предлагается вариант решения проблемы оперативного поиска информации в неструкту-рированных информационных ресурсах. Построены и описаны четыре основных блока, реализующих поиск информации по смысловым значениям. В статье предлагается алгоритм решения задачи оценки соответ-ствия смыслового содержания текстовых документов заданной предметной области. Предложенный инфологический подход выполнен на основе анализа данных патентного поиска, опубликованных научных работ и проведенных экспериментальных исследований эффективных методов автоматической оценки содержания неструктурированных информационных ресурсов для организации процессов информационно-аналитического обеспечения научной деятельности. В работе предложен способ оценки и сопоставления тематической направленности данных в не-структурированных информационных ресурсах, на основе применении инфологической системы. Данный способ предполагает проведение кластеризации текстовых документов путем сравнения семантическо-го содержания исследуемого текста и антологии. Описана структура поисковой подсистемы, имеющей сервисно-ориентированную клиент-серверную архитектуру с тонким клиентом (веб-обозреватель). Опи-санный метод был апробирован на наборе текстов, полученных в результате мониторинга открытых публичных инфокоммуникационных Интернет-ресурсов без ограничения темы (получено и обработано более 1 млн. экземпляров текстов). Среди полученных текстов экспертным путем была сформирована обучающая выборка для следующих типов текстов: художественные тексты, научные технические статьи, автоматически сгенерированные псевдонаучные тексты, полученные в результате работы систем, спам-содержащие тексты. Предложен состав и описана общая архитектура программного обеспечения инфологической системы, основные компоненты системы являются кросс-платформенными. На основе результатов экспериментальных исследований показана принципиальная возможность реализации автоматизирован-ной оценки тематического подобия документов на примере инфологической обработки текстов рабочих программ дисциплин, сформированы требования, предъявляемые к программному интерфейсу взаимодей-ствия макета с внешними поисковыми системами.

Об авторах

С. Н. Михайлов
ФГБОУ ВО «Юго-Западный государственный университет»
Россия


О. Е. Ключникова
ФГБОУ ВО «Юго-Западный государственный университет»
Россия


Список литературы

1. Михайлов С.Н. Способ тематической кластеризации текстовых документов на основе их инфологической обработки // Наукоемкие технологии. 2012. Т. 13, № 9. С. 48-51.

2. Кулешов С.В., Михайлов С.Н. Вариант архитектуры субпоисковой системы для реализации функции аналитического мониторинга // Труды СПИИРАН. 2013. № 8 (31). С. 247-254

3. Зайцева А.А., Кулешов С.В., Михайлов С.Н. Метод оценки качества тек-стов в задачах аналитического мониторинга информационных ресурсов// Труды СПИИРАН. 2014. № 6. С. 144-155.

4. Михайлов С.Н., Кулешов С.В. Экспертный мониторинг неструктурированных информационных ресурсов в интересах информационно-аналитического обеспечения космических исследований// Известия Юго-Западного государственного университета. 2013. № 6-2 (51). С. 40-43.

5. Михайлов С.Н., Агапченко К.И. Способ инфологической обработки рабочих программ дисциплин для оценки подобия тематического содержания лекционных курсов // Инфокоммуникации и информационная безопасность: состояние, проблемы и пути решения: материалы I Всероссийской научно-практической конференции. Курск, 2014. С. 128-136.

6. Михайлов С.Н., Чуйкова В.В. Способ оценки содержания дисциплин отдельного направления подготовки требуемым компетенциям // Известия Юго-Западного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение. 2014. № 3. С. 19-24.

7. Михайлов С.Н., Хотынюк С.С., Потапенко А.М. Технологии интерактивного выявления смыслового содержания текстов в целях организации информационно-аналитического обеспечения научных исследований // Известия Юго-Западного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение. 2013. № 4. С. 29-34.

8. Михайлов С.Н., Тезик К.А. Вариант программной реализации способа тематической кластеризации текстовых документов на основе использования макросов VBA и EXCEL // Известия Юго-Западного государственного университета. 2012. № 4 (43), ч.2. С. 17-21.

9. Михайлов С.Н., Севрюков А.Е. Обобщенная архитектура инфокоммуникационной среды информационно-ана-литического обеспечения научных исследований вуза // Информационно-измери-тельные и управляющие системы. 2010. Т. 8, № 11. С. 40-42.

10. Марухленко А.Л., Конарев Д.И., Якушев А.С. Сравнение текстов на основе анализа и сопоставления их смысловых значений // Инфокоммуникации и информационная безопасность: состояние, проблемы и пути решения: материалы II Всероссийской научно-практической конференции. Курск, 2015. C.168-171.

11. Марухленко А.Л., Коршунов Е.Е., Якушев А.С. Вариант нормализации первичных данных с учетом семантической составляющей // Инфокоммуникации и информационная безопасность: состояние, проблемы и пути решения: материалы II Всероссийской научно-практической конференции. Курск, 2015. C.171-176.

12. Потапенко А.М., Юрченко А.Г., Попадинец Р.В. Семиотическая модель языка // Нейрокомпьютеры: разработка, применение. 2014. № 6. С. 34-41

13. Исследование и разработка научно-технических путей создания информационно-телекоммуникационной системы аналитического мониторинга в неструктурированных информационных ресурсах: отчет о НИР / Юго-Зап. гос. ун-т (ЮЗГУ); рук. М.В. Соколова. Курск, 2015. 293 с. № 2.2491.2014/К.

14. Тезик К.А., Михайлов С.Н. Методика планирования эксперимента в целях распознавания тематической направленности информационных ресурсов сети интернет // Инфокоммуникации и ин-формационная безопасность: состояние, проблемы и пути решения: материалы II Всероссийской научно-практической кон-ференции. Курск, 2015. С.72-79.

15. Классификация форматов файлов для задач селекции документов / А.С. Якушев [и др.] // Инфокоммуникации и информационная безопасность: состояние, проблемы и пути решения: материалы I Всероссийской научно-практической конференции. Курск, 2014. С. 289-293.

16. Потапенко А.М., Русанов Р.Н. Проблема информационного поиска по содержанию // Известия Юго-Западного государственного университета. Серия Управление, вычислительная техника, информатика. Медицинское приборостроение. 2012. № 2, ч.3. С. 100-102.

17. Потапенко А.М., Юрченко А.Г. Схема образования языковых знаков в естественно-языковых текстах // Нейро-компьютеры: разработка, применение. 2014. № 6. С. 41-44.

18. Персонализированная система поиска информации с функцией определения тематики и анализа смысловых значений / А.М. Потапенко, А.Л. Марухленко, Д.И. Конарев, А.С. Якушев // Инфокоммуникации и информационная безопасность: состояние, проблемы и пути решения: материалы II Всероссийской научно-практической конференции. Курск, 2015. С. 181-187.


Рецензия

Для цитирования:


Михайлов С.Н., Ключникова О.Е. ИНФОЛОГИЧЕСКАЯ СИСТЕМА АНАЛИТИЧЕСКОГО МОНИТОРИНГА ДАННЫХ В НЕСТРУКТУРИРОВАННЫХ ИНФОРМАЦИОННЫХ РЕСУРСАХ. Известия Юго-Западного государственного университета. 2017;21(5):45-61. https://doi.org/10.21869/2223-1560-2017-21-5-45-61

For citation:


Mikhailov S.N., Klyuchnikova О.Е. INFOLOGICAL MONITORING SYSTEM OF ANALYTICAL DATA UNSTRUCTURED CONTENT. Proceedings of the Southwest State University. 2017;21(5):45-61. (In Russ.) https://doi.org/10.21869/2223-1560-2017-21-5-45-61

Просмотров: 449


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2223-1560 (Print)
ISSN 2686-6757 (Online)