Model of educational texts for markup in a corpus of scientific and technical texts

Authors

  • Iuliia I. Butenko Bauman Moscow State Technical University

DOI:

https://doi.org/10.52575/2687-0932-2021-48-1-123-129

Keywords:

text structure, structural element, text model, scholarly text, corpus of scientific and technical texts

Abstract

The article proposes a model for the structure of scholarly texts for marking up a corpus of scientific and technical texts. The article substantiates the need to take into account the composition structure of scholarly texts when marking up the corpus. The necessity of adding structural markup to the corpus of scientific and technical texts has been shown. It is noted that scholarly texts have the same for all the texts of this class, as well as contain a limited set of structural elements.  The structural elements of an scholarly texts are characterized. The approximate content of each element of scholarly texts is described.  The composition structure of scholarly text is presented in Bekus-Naur notation. The model of scholarly texts is proposed in the form of graph, the nodes and edges of which are full-fledged structural elements of scholarly texts. It is proved that the representation of scholarly texts in the form of a graph makes it possible to determine the type of a structural element, the degree of nesting, in the process of computer analysis of the text, by presenting the scholarly text as a finite set of its constituent parts.

Downloads

Download data is not yet available.

Author Biography

Iuliia I. Butenko, Bauman Moscow State Technical University

Candidate of Technical Sciences, Associate professor of the Department Theoretical Informatics and Computer Technologies, Bauman Moscow State Technical University, Moscow, Russia

References

Бутенко Ю.И. 2020. Модель текста стандарта при информационном поиске в коллекции документов нормативной базы. Вестник компьютерных и информационных технологий,

(11): 23–32. DOI: 10.14489/vkit. 2020.11.pp.023-032.

Бутенко Ю.И., Семенова Е.Л. 2019. Влияние лингвистических особенностей текстов стандартов на информационный поиск. Филологические науки. Научные доклады высшей школы, 6: 29-35. DOI: 10.20339/PhS.6-19.029.

Ванюшкин А.С., Гращенко Л.А. 2018. О разметке корпусов текстов ключевыми словами. Новые информационные технологии в автоматизированных системах, 21: 207–211.

Егоров В.В., Скибицкий Э.Г., Храпченков В.Г. 2008. Педагогика высшей школы. Новосибирск. САФБД: 260.

Захаров В. П. 2015. Корпуса русского языка. Труды института русского языка имени В.В. Виноградова, 6: 20–65.

Кружков М.Г. 2015. Информационные ресурсы контрастивных лингвистических исследований: электронные корпуса текстов. Системы и средства информатики, 25 (2): 140–159.

Лесников В.С. 2019. Виды разметок текстовых корпусов русского языка. Научно-техническая информация. Серия 2. Информационные процессы и системы, 9: 27–30.

Лупачев В.Г., Павлюк С.К. 2011. Методические основы и принципы разработки учебной литературы: методическое пособие для слушателей курсов повышения квалификации и переподготовки кадров; под ред. В.А. Сидорова. Минск. БНТУ: 63.

Лыков М.Н. 2008. Оглавление как структурный элемент вузовского учебника

(на примере учебника по истории отечества для высшей школы). Альманах современной науки и образования, 10-1 (17): 102–105.

Нагель О.В. 2008. Корпусная лингвистика и ее использование в компьютеризированном языковом обучении. Язык и культура, 4: 53–59.

Рыбакова Г.Р. 2011. О категории «учебный текст» в научной литературе. Научное обозрение. Серия 2: Гуманитарные науки, 6: 64–73.

Соловьева А.Е. 2019. Англоязычные тексты военной авиации как основа лингвистического корпуса. Балтийский гуманитарный журнал, 3 (28): 369–372.

Тюрина Л.Г. 2007. Особенности текста учебной книги. Известия высших учебных заведений. Проблемы полиграфии и издательского дела, 3: 70–73.

Тюрина Л.Г. 2005. Состав и структура учебной книги как педагогической системы. Известия высших учебных заведений. Проблемы полиграфии и издательского дела, 4: 78–88.


Abstract views: 66

Share

Published

2022-09-19

How to Cite

Butenko, I. I. (2022). Model of educational texts for markup in a corpus of scientific and technical texts. Economics. Information Technologies, 48(1), 123-129. https://doi.org/10.52575/2687-0932-2021-48-1-123-129

Issue

Section

SYSTEM ANALYSIS AND PROCESSING OF KNOWLEDGE