Preview

Proceedings of the Southwest State University

Advanced search

INFOLOGICAL MONITORING SYSTEM OF ANALYTICAL DATA UNSTRUCTURED CONTENT

https://doi.org/10.21869/2223-1560-2017-21-5-45-61

Abstract

In operation the way of solving the problem of quick search of information in unstructured information resources is offered. Four main units realizing information search in semantic values are constructed and described. In article the algorithm of the decision of the task of assessment of compliance of semantic contents of text documents of the given data domain is offered. The offered infologichesky approach is executed on the basis of data analysis of patent search, the published scientific operations and the conducted pilot studies of effective methods of automatic assessment of maintenance of unstructured information resources for the organization of processes of information and analytical support of scientific activities. In operation the method of assessment and comparison of a subject directivity of data in unstructured information resources, on a basis use of infologichesky system is offered. This method assumes carrying out a clustering of text documents by comparing of semantic contents of the researched text and the anthology. The structure of the retrieval subsystem having the service-oriented client-server architecture with the thin client (web observer) is described. The described method was approved on a set of the texts received as a result of monitoring of open public infocommunication Internet resources without restriction of a subject (more than 1 million copies of texts are received and processed). Among the received texts by an expert way learning selection for the following types of texts was created: artistic texts, scientific technical articles, the pseudoscientific texts received as a result of operation of systems, a spam automatically generated - the containing texts. The composition is offered and the general architecture of the software of infologichesky system is described, principal components of system are cross-platform. On the basis of results of the pilot studies the basic possibility of implementation of automated assessment of subject similarity of documents on the example of infologichesky processing of texts of working programs of disciplines is shown, requirements imposed to the program interface of interaction of a prototype with external search engines are created.Key words: infological system, assessment of the thematic similarity, information resource working program of discipline, competence, semantic analysis, meaning.

About the Authors

S. N. Mikhailov
Southwest State University
Russian Federation


О. Е. Klyuchnikova
Southwest State University
Russian Federation


References

1. Михайлов С.Н. Способ тематической кластеризации текстовых документов на основе их инфологической обработки // Наукоемкие технологии. 2012. Т. 13, № 9. С. 48-51.

2. Кулешов С.В., Михайлов С.Н. Вариант архитектуры субпоисковой системы для реализации функции аналитического мониторинга // Труды СПИИРАН. 2013. № 8 (31). С. 247-254

3. Зайцева А.А., Кулешов С.В., Михайлов С.Н. Метод оценки качества тек-стов в задачах аналитического мониторинга информационных ресурсов// Труды СПИИРАН. 2014. № 6. С. 144-155.

4. Михайлов С.Н., Кулешов С.В. Экспертный мониторинг неструктурированных информационных ресурсов в интересах информационно-аналитического обеспечения космических исследований// Известия Юго-Западного государственного университета. 2013. № 6-2 (51). С. 40-43.

5. Михайлов С.Н., Агапченко К.И. Способ инфологической обработки рабочих программ дисциплин для оценки подобия тематического содержания лекционных курсов // Инфокоммуникации и информационная безопасность: состояние, проблемы и пути решения: материалы I Всероссийской научно-практической конференции. Курск, 2014. С. 128-136.

6. Михайлов С.Н., Чуйкова В.В. Способ оценки содержания дисциплин отдельного направления подготовки требуемым компетенциям // Известия Юго-Западного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение. 2014. № 3. С. 19-24.

7. Михайлов С.Н., Хотынюк С.С., Потапенко А.М. Технологии интерактивного выявления смыслового содержания текстов в целях организации информационно-аналитического обеспечения научных исследований // Известия Юго-Западного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение. 2013. № 4. С. 29-34.

8. Михайлов С.Н., Тезик К.А. Вариант программной реализации способа тематической кластеризации текстовых документов на основе использования макросов VBA и EXCEL // Известия Юго-Западного государственного университета. 2012. № 4 (43), ч.2. С. 17-21.

9. Михайлов С.Н., Севрюков А.Е. Обобщенная архитектура инфокоммуникационной среды информационно-ана-литического обеспечения научных исследований вуза // Информационно-измери-тельные и управляющие системы. 2010. Т. 8, № 11. С. 40-42.

10. Марухленко А.Л., Конарев Д.И., Якушев А.С. Сравнение текстов на основе анализа и сопоставления их смысловых значений // Инфокоммуникации и информационная безопасность: состояние, проблемы и пути решения: материалы II Всероссийской научно-практической конференции. Курск, 2015. C.168-171.

11. Марухленко А.Л., Коршунов Е.Е., Якушев А.С. Вариант нормализации первичных данных с учетом семантической составляющей // Инфокоммуникации и информационная безопасность: состояние, проблемы и пути решения: материалы II Всероссийской научно-практической конференции. Курск, 2015. C.171-176.

12. Потапенко А.М., Юрченко А.Г., Попадинец Р.В. Семиотическая модель языка // Нейрокомпьютеры: разработка, применение. 2014. № 6. С. 34-41

13. Исследование и разработка научно-технических путей создания информационно-телекоммуникационной системы аналитического мониторинга в неструктурированных информационных ресурсах: отчет о НИР / Юго-Зап. гос. ун-т (ЮЗГУ); рук. М.В. Соколова. Курск, 2015. 293 с. № 2.2491.2014/К.

14. Тезик К.А., Михайлов С.Н. Методика планирования эксперимента в целях распознавания тематической направленности информационных ресурсов сети интернет // Инфокоммуникации и ин-формационная безопасность: состояние, проблемы и пути решения: материалы II Всероссийской научно-практической кон-ференции. Курск, 2015. С.72-79.

15. Классификация форматов файлов для задач селекции документов / А.С. Якушев [и др.] // Инфокоммуникации и информационная безопасность: состояние, проблемы и пути решения: материалы I Всероссийской научно-практической конференции. Курск, 2014. С. 289-293.

16. Потапенко А.М., Русанов Р.Н. Проблема информационного поиска по содержанию // Известия Юго-Западного государственного университета. Серия Управление, вычислительная техника, информатика. Медицинское приборостроение. 2012. № 2, ч.3. С. 100-102.

17. Потапенко А.М., Юрченко А.Г. Схема образования языковых знаков в естественно-языковых текстах // Нейро-компьютеры: разработка, применение. 2014. № 6. С. 41-44.

18. Персонализированная система поиска информации с функцией определения тематики и анализа смысловых значений / А.М. Потапенко, А.Л. Марухленко, Д.И. Конарев, А.С. Якушев // Инфокоммуникации и информационная безопасность: состояние, проблемы и пути решения: материалы II Всероссийской научно-практической конференции. Курск, 2015. С. 181-187.


Review

For citations:


Mikhailov S.N., Klyuchnikova О.Е. INFOLOGICAL MONITORING SYSTEM OF ANALYTICAL DATA UNSTRUCTURED CONTENT. Proceedings of the Southwest State University. 2017;21(5):45-61. (In Russ.) https://doi.org/10.21869/2223-1560-2017-21-5-45-61

Views: 446


Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 License.


ISSN 2223-1560 (Print)
ISSN 2686-6757 (Online)