Preview

Proceedings of the Southwest State University

Advanced search

A METHOD OF SEQUENTIAL SEARCHING OF OCCURANCES IN TEXT WITH THE ACCOUNT OF POSSIBLE COLLISIONS

https://doi.org/10.21869/2223-1560-2017-21-4-68-74

Abstract

One of the fundamental tasks of modern computer information systems is processing of symbol information, the amount of which prevails in the total amount of information. At present, rules-based approach is effectively applied to the tasks of processing symbol information. The paper deals with the peculiarities of text search applying rules-based approach. The main essence of the approach is to find pattern occurrences in the text and possible implementation of substitution (text modification). Meanwhile, when implementing search for occurrences, various kinds of collisions may arise. They should be taken into account to solve the set tasks correctly. For example, algorythms of sequential word matching can run into collisions which involve the possibility of skipping positions of pattern occurrence in a word with some structural peculiarities. The paper presents a method of searching taking into account possible collisions developed by the authors, as well as algorithmic and automatic models of the method. The developed method involves patterm markup and setting a sequence of its viewing in the form of algorithm diagram. Three algorythms (implementation variants) of the method have been developed. Algorithms differ in the possibility to carry out transition to this oк that position of the pattern and the text depending on the result of matching (equality or inequality of the current symbols of the patten and text). An automation model of the method has been developed. The proposed method of sequential matching with the pattern with collisions elimination increases the effectiveness of the computer system when implementing search procedures and symbol information processing. The method can be used in the systems of symbol information processing.

About the Authors

I. N. Efremova
Southwest State University
Russian Federation


V. V. Efremov
Southwest State University
Russian Federation


N. A. Emelianova
Kursk State Medical University
Russian Federation


References

1. Ефремова И.Н., Ефремов В.В. Способ сопоставления символьной информации с множеством образцов // Известия Юго-Западного государственного университета. 2012. №3 (42). Ч.1. С.50-53.

2. Ефремова И.Н., Ефремов В.В. Спо-соб аннулирования коллизий при сопоставлении слов // Известия Юго-Запад-ного государственного университета. 2013. №1 (46). С.20-22.

3. Ефремова И.Н., Ефремов В.В. Способы и устройства обработки символьной информации. Курск, 2014. 182 с.

4. Информационные системы обработки и сжатия текста / В.В. Ефремов, И.Н. Ефремова, В.В. Серебровский, А.А. Черепанов // Научные ведомости Белгородского государственного университета. Серия: Экономика. Информатика. 2014. Т. 29. № 1-1 (172). С. 182-184.

5. Ефремова И.Н., Ефремов В.В. К вопросу повышения эффективности автоматической обработки текстов. Современное общество, образование и наука: сборник научных трудов по материалам Международной научно-практической конференции: в 9 ч. М., 2014. С. 22-23.

6. Серебровский В.В., Ефремова И.Н., Ефремов В.В. К вопросу представления семантики естественно-языковых текстов // Известия Юго-Западного государственного университета. Серия: Уп-равление, вычислительная техника, информатика. Медицинское приборостроение. 2014. № 2. С. 37-41.

7. Серебровский В.В., Ефремова И.Н., Ефремов В.В. К вопросу учета смысловой составляющей текста в информационно-поисковых системах // Известия Юго-Западного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение. 2015. № 2 (15). С. 8-12.

8. Ефремова И.Н., Ефремов В.В. Способ неточного поиска в тексте, содержащем ошибки антропогенного характера // Известия Юго-Западного государственного университета. Серия: Уп-равление, вычислительная техника, информатика. Медицинское приборостроение. 2015. № 2 (15). С. 54-61.

9. К вопросу учета смысловой составляющей текста в информационно-по-исковых системах в медицине / И.Н. Ефремова, В.В. Ефремов, Н.А. Емельянова // Научные механизмы решения проблем инновационного развития: сборник статей Международной научно-практической конференции. М., 2016. С. 229-230.

10. Разработка концепции информационной системы построения информационно - образовательного мультимедийного интерактивного пространства / В.И. Шнырков, В.В. Ефремов, И.Н. Ефремова, Н.Н. Бочанова //Известия Юго-Западного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение. 2012. № 2-3. С. 16-20.


Review

For citations:


Efremova I.N., Efremov V.V., Emelianova N.A. A METHOD OF SEQUENTIAL SEARCHING OF OCCURANCES IN TEXT WITH THE ACCOUNT OF POSSIBLE COLLISIONS. Proceedings of the Southwest State University. 2017;21(4):68-74. (In Russ.) https://doi.org/10.21869/2223-1560-2017-21-4-68-74

Views: 417


Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 License.


ISSN 2223-1560 (Print)
ISSN 2686-6757 (Online)