§ 8. Применение компьютера

{{62}}Применение калькуляционного метода невозможно без компьютера. Действительно, 10 списков составляют 40 пар, 20 списков — уже 180 пар, для каждой пары подсчеты должны опираться не менее чем на сто узлов. Все это образует громадный объем механической работы. Алгоритм сопоставления источников в выделенных узлах разночтений может быть описан следующим образом.

Вариантным чтениям в узлах присваиваются номера, их число не меньше двух и обычно не более шести. Лакуны и индивидуальные чтения обозначаются нулем, который при всех операциях в расчет не принимается. Таким образом, каждая рукопись может быть записана как последовательность цифр, в которой место цифры соответствует порядковому номеру узла разночтении, а ее числовое значение соответствует условному номеру варианта. Данные по всем рукописям вводятся в компьютер, так что в машинной памяти формируется таблица, в которой число колонок равно числу рукописей, а число строк равно числу узлов разночтений. На первом этапе работы компьютер сравнивает между собою колонки цифр попарно, устанавливая: 1) число узлов разночтений для каждой пары (от общего числа узлов отнимаются те узлы, которые обозначены нулями), 2) количество совпадающих вариантов (а это одинаковые цифры в одной и той же строке), 3) процентное отношение числа совпадений к числу узлов, по которым сравниваются рукописи.*{{(3) В принципе в компьютер могут быть введены сами тексты, тогда описанной процедуре калькуляции будут предшествовать сложные этапы нормализации орфографии источников, отождествления текстологически релевантных вариантов, их условной записи, т. е. все то, что в данном случае исследователь производит вручную. При большом количестве рукописных источников такой путь многократно увеличивает объем работы, потому что компьютерной обработке приходится подвергать и те данные, которые в дальнейшем не используются. Программа полной компьютерной обработки рукописных источников создана в Оксфорде доктором Робинсоном (Р. М. W. Robinson) и применялась в славистике Ваккером (Bakker 1996).}}

На втором этапе работы компьютер переставляет столбцы и строки матрицы так, чтобы рукописи с высоким процентом совпадений оказались собраны вместе в группы. В данном случае применяется один из приемов кластерного анализа. Компьютер сравнивает рукописи в порядке убывания процента общих чтений. Две рукописи, имеющие наибольшую степень сходства, образуют первый кластер (англ. cluster — «пучок, гроздь»). Следующая пара либо образует новый кластер, либо приписывается к первому, если одна из рукописей уже вошла в него. Таким образом в порядке убывания общих чтений рассматриваются все пары рукописей. {{63}}В конце этого процесса все списки объединяются в один кластер. Порядок следования рукописей в этом кластере, охватившем все источники, соответствует порядку объединения рукописей в кластеры.

Упорядоченная квадратная таблица, в которой по вертикали и по горизонтали перечислены в одном и том же порядке образующие ее источники, а цифры в местах пересечений указывают процент общих чтений, дает наглядное представление о результатах проведенной калькуляции. Выделение текстовых групп путем обведения части цифр сплошными или прерывистыми линиями произодится в соответствии с одним из промежуточных шагов кластерного анализа, пока источники не были объединены в единый итоговый кластер. Образцы подобных таблиц см.: Алексеев 1986; Алексеев, Лихачева 1987; описание методики ЭВМ см.: Алексеев, Кузнецова 1988.

 

Hosted by uCoz