Модуль 6. Методология формирования научных компетенций

Цифровая гуманитаристика

наставничество в школьных исследовательских проектах

Если ты что-то хорошо понимаешь, ты можешь это объяснить ребенку, если понимаешь очень хорошо, то сможешь объяснить это компьютеру
А.Левенчук

цифровая гуманитаристика

наставничество в школьных исследовательских проектах

Если ты что-то хорошо понимаешь, ты можешь это объяснить ребенку, если  понимаешь очень хорошо,

то сможешь объяснить это компьютеру
А.Левенчук
 

ЗАНЯТИЕ ПЕРВОЕ: ИСТОРИЯ DIGITAL HUMANITIES

История вопроса

DH — это все виды применения информационных технологий и математических методов к решению задач в гуманитарных науках

Более детальная историография DH представлена в трудах Таллера Манфреда, ознакомиться с конспектом можно по ссылке

ЗАНЯТИЕ ВТОРОЕ: СПЕЦИФИКА DH

Что считается DH-исследованиями?

Джон Ансворт: "...гуманитарная информатика – это практика воспроизведения и моделирования <...> способ мышления и набор онтологических критериев, а его практическая реализация определяется необходимостью, с одной стороны, эффективной работы с компьютером, а с другой стороны – необходимостью человеческого общения"...

В каком-то смысле DH породило понятие отраслевых информатик: компьютерную лингвистику, историческую информатику и социологическую информатику, биоинформатику и др.

До сих пор ученые спорят о границах информатики и гуманитарных наук, о тех свойствах, которые делают DH сквозной технологией. Коротко поиск границ можно сформулировать следующим образом: если вы удовлетворяете исследовательский интерес только в рамках традиционных методов гуманитарных наук, то вы не занимаетесь DH, и, с другой стороны, если вы решаете задачи гуманитарного исследования возможностями информационных технологий, создавая новые исследовательские задачи - вы занимаетесь DH.

Пример такого исследования: поиск и различение оригинальных текстов Шекспира от подражаний и правок его современников. Если бы эту задачу выполнял человек, он бы неизбежно привносил элементы интерпретации, свойственные нашему исследовательскому вниманию. С другой стороны, эта машинная разработка позволила формализовать представления о языке Шекспира и поставить новые вопросы в его изучении. Подробнее о проекте можно узнать здесь.
 

ЗАНЯТИЕ ТРЕТЬЕ: ОСОБЕННОСТИ МЕТОДОВ ИССЛЕДОВАНИЙ DH

Методы DIGITAL HUMANITIES

 

DH в истории

Тайм лайн развития Древнего Рима

 

DH в архитектуре и истории

Примеры использования 3D реконструкции и фотографии 360

 

DH в исследовании медицины и биологии

Работа с данными в области пищевого поведения

ЗАНЯТИЕ ЧЕТВЕРТОЕ: РАЗЛИЧЕНИЕ ГУМАНИТАРНОГО И ЕСТЕСТВЕННОНАУЧНОГО ИССЛЕДОВАНИЯ

Работа ученого-гуманитария

Представим неполную специфику методов исследования в области гуманитарных наук

Посмотрите лекцию Григория Юдина и ответьте на вопросы:

1. Какой тезис вы бы привели в доказательство, что гуманитарные науки являются науками?

2. Какое различие между науками о духе и естественными науками зафиксировал В. Дильтей по предмету гуманитарного исследования?

3. Какое различие между науками о духе и естественными науками зафиксировал Виндельбант по методам исследования?

Лекция Григория Юдина

Естественные и гуманитарные науки, Постнаука

Появление средств математической обработки данных в гуманитарных исследованиях в каком-то смысле снимает проблематику достоверности результатов исследования с точки зрения критериев достоверности естественных наук.

Первый Центр гуманитарной информатики был создан в университете Виргинии в 1986 г. на основе лингафонной лаборатории. Она занималась разработкой мультимедийных технологий.

Российская ассоциация DH была создана в 2015 году и объединяет несколько ведущих университетов РФ:
ВШЭ Пермь, ВШЭ Москвы, ИТМО

ЗАНЯТИЕ ПЯТОЕ: МЕЖДИСЦИПЛИНАРНОСТЬ DH

Задачи междисциплинарного исследования

Здесь важно отличить сам инструмент от области его применения. Машина с ее свойствами прагматической универсальности работы с информацией способна размывать границы между науками и видами деятельности. Любая манипуляция на компьютере может быть названа работой с данными (отправка письма, работа в текстовом редакторе, работа с данными в Excel).

В цифровых гуманитарных вычислениях компьютер используется как средство моделирования гуманитарных данных и нашего осмысления их.

Этот вид деятельности отличен от использования компьютера в качестве "самопишущей машинки".

Для программистов даем ссылку на канал Computer Science Center.

Новый объект (медиаобъект, инфообъект) должен быть описан формально (математически). Например, изображение или фигуру можно описать с помощью математической функции. Набор данных с помощью графов. Информация является объектом алгоритмического манипулирования, применяя соответствующие алгоритмы, мы можем автоматически удалить "шум" из фотографии, построить интерактивную карту данных, найти края фигур, или изменить его пропорции. Артефакты знания становятся программируемыми.

Из-за сложности междисциплинарной задачи по DH мы должны с неизбежностью констатировать, что наставническая позиция должна учитывать необходимость закрыть задачи и в гуманитарной, и в IT-сфере.

ЗАНЯТИЕ ШЕСТОЕ: МЫШЛЕНИЕ И IT

Машинное обучение и мышление

типология


Первый взгляд исходит из кибернетического представлении о человеке, восходящем к бихевиористическому взгляду на поведенческие мотивы человеческой деятельности, на принцип "уравновешенности со средой" Павлова. Мышление в этом случае сводится к алгоритмам восприятия, программам (сценариям) поведения. Все чаще мы можем услышать машинные метафоры в описании работы мозга человека (ассоциирующемся с мышлением): процессор, объем памяти, высокая степень обработки данных и так далее. Свойства машины "действовать" путем перебора огромного количества данных для принятия оптимального решения (программы, играющие с людьми в шахматы) было перенесено на человеческое мышление, в результате этого появились утверждения, что:
 

  • мышление равно сбору информации или есть его частный случай;
  • нейрофизиология мозга человека - это аналог процессов формальных нейронных сетей и их технических воплощений;
  • все мыслительные операции могут быть выражены на языке информационно-логических программ.

Это направление питает все разработки по ИИ.

Второй взгляд восходит к деятельностному принципу развития мышления, у истоков которого стоит Выготский, Давыдов и Щедровицкий. Согласно этому подходу мышление человека не существует вне общества, вне языка, вне накопленных человечеством знаний и выработанных им способов мыслительной деятельности: логических, математических и других действий и операций…(А.Н. Леонтьев)


Это второе направление породило идею создания инструментов "усилителя человеческого интеллекта"
Ознакомьтесь с текстом Станислава Лема "Сумма технологии", Усилитель интеллекта

Сегодня можно констатировать, что мышление формализовать не удается. Более того такие попытки в DH считаются mauvais ton.

Но попытки формализации привели к созданию неких общих форм и методов системы представления знаний. Разработанные главным образом для решения задач машинной лингвистики, иерархические системы представления и использования знаний, обычно строятся на основе математической логики, фреймов, семантических сетей или графов. Все такие системы можно считать шагом в нужном направлении, это способы перехода от данных к знаниям.


 

ЗАНЯТИЕ СЕДЬМОЕ

IT-инструментарий в DH


Одним из старейших способов моделирования понимания текста можно считать конкорданс. Предполагается, что словесная модель в тексте – ключ к его пониманию. Конкорданс осуществляет текстовый анализ, поскольку может сообщать о частоте, с которой слова используются в тексте, или о частоте, с которой слова определенной длины встречаются в тексте. Конкорданс может убедить нас в том, что некоторые слова в тексте не несут значения, если есть функция запрета на определенные слова, а при наличии лемматизатора с помощью конкорданса можно подтвердить ту точку зрения, что корни слов более важны и так далее. Примеры конкордансов.
 

Реляционная база данных
Вторым проверенным способом построения моделей является способ реляционных БД.
Операции мышления представлены в таблицах запросов, так как эта форма позволяет устанавливать определенные связи между ячейками двумерных таблиц.

 

Составление онтологий

В отличии от философского понятия онтологии в информатике онтологии носят прагматический характер. Они строятся под решения конкретных инженерных задач и представляют собой формализованные иерархически описанные структуры отдельных областей знаний. Примеры.

Н.С. Константинова, О.А. Митрофанова Онтологии как системы хранения знаний
 

Скрытая семантическая индексация (ССИ) основана на ЛСА

Этот метод имеет сходство с конкордансом. он опирается на составные элементы документа, чтобы найти подходящее семантическое содержание (семантическое ядро текста). В любом случае, методика ССИ рассматривает термины как "ненадежные" индикаторы понятий в конкретном тексте. Методика исходит из предположения, что вариативность выбора слов частично затеняет семантическую структуру документа. Сокращая тексты выборкой, мы обнаруживаем лежащие в основе семантические ядра разных документов, и таким образом ликвидируем «смысловой шум». Метод ССИ анализирует статистику использования форм слова во всех анализируемых текстах. При этом тексты с похожим использованием слов, помещаются в отдельном окне, это значит, что семантически связанные тексты могут располагаться рядом, даже если набор терминов у них не совпадает.

Zoouniverse.org, проект «гражданской науки», он привлекает интернет-пользователей к решению исследовательских задач, в 2014 г. уже привлек более 1,1 млн участников;

Ushahidi — некоммерческий интернет-сервис, предоставляющий платформу для создания информационных массивов, визуализации данных и создания интерактивных карт. Предоставляет возможность отображения данных на мультимедийных картах в целях мониторинга выборов, состояния окружающей среды, распространения эпидемий и других процессов;

GitHub — программная среда совместной веб-разработки научных исследовательских проектов с открытым исходным кодом;

Myexperiment — сервис по проектированию плана и этапов реализации исследовательских проектов, объединяет ряд британских университетов и порядка десяти тысяч исследователей по всему миру.
Все эти методы и инструменты позволяют перевести гуманитарные знания на формальный язык, понятный компьютеру, так, чтобы получившиеся утверждения были связными и соответствовали установленным правилам. С другой стороны, они неизбежно редуцируют экспрессивность, смысловые оттенки, нюансов, некоторых значений.

DH-специалисты часто усомневают полноту этих методов и вкладываются в разработку новых.

 

ЗАНЯТИЕ ВОСЬМОЕ

Что должен делать наставник DH

А.Ю.Володин: "DH – это проектный подход к решению научных проблем, предполагающий в качестве итога исследовательского труда конкретный информационный цифровой продукт..."

Итак, мы выяснили, что наставник DH-исследований удерживает сочетание методологии традиционных гуманитарных наук и методологии и логики исследований естественного профиля: математики, информатики, статистики, компьютерного анализа, машинного обучения, биологии, нейрофизиологии.

Сегодня расширяются области применения цифровых гуманитарных наук, что, вероятно, приведет в ближайшие десятилетия к увеличению числа исследований и объемов средств, выделяемых на развитие Digital Humanities.

 

Приведем примеры тем DH исследований для филологов

Визуализация точки зрения автора "Легкого дыхания" или Бунин - прародитель фейсбука.

Попытка исследования цвета в поэзии <...> цифровыми методами

Социальные связи Натальи Ростовой: построение сетевого графа в "мире" и в "войне".

Прочитайте формулировки тем и постройте гипотезы, позволяющие сделать эти темы DH исследованиями историков и культурологов

География распространения торговых отношений Древнего Китая в эпоху развития Шелкового Пути

Архитектурное наследие А.Д. Крячкова в архитектурном облике Новосибирска

Сравнение кинопоэтики фильмов К. Муратовой и А. Тарковского

ПОЛЕЗНЫЕ РЕСУРСЫ

Что можно посмотреть и почитать о DH

1. Интересный курс по DH Гарварда, английский язык простой, пользуйтесь любым ресурсом перевода больших текстов, например этим.

2. Здесь вы найдете сообщения по Data&Science: цифровые методы в гуманитарных науках, подписывайтесь на это канал

3. На этом же канале опубликовано 30- минутное сообщение Динары Гагариной об истории DH

4. Исследование миграции членов семьи династии Мин 1371 - 1610, результаты.

5. Невероятная ландшафтная карта архитектурных стилей и тенденций моды в разные периоды развития человеческой культуры

6.Исследование "Великие дома не делают людей святыми: нищая архитектура в средневековом Оксфорде"

7. Интересная работа DHLab обучения ИИ обработке фотографий, в результате была собрана огромная коллекция изображений, объединенная общими визуальными характеристиками. Человеческий глах не может выполнить такого рода работу.

8. DH в Тюменской государственном университете

9. Выставка "Искусственный интеллект и диалог культур"

10. ИИ веселится, превращая каракули в фотографии

11. Статья, рассказывающая о том, что машина не умеет распознавать форму изображения, но прекрасно распознает текстуру

12. Отличная статья, по которой можно восстановить методику работы с оригинальным языком текста. В данном случае доказывается гипотеза об авторстве "Тихого Дона" Шолохова

13. История развития ЭВМ и программирования
 

ЗАНЯТИЕ ДЕВЯТОЕ

История и география в DH-исследованиях

 

Для вдохновения визуализация статистических данных по росту городов. Пока это несовершенная модель. Ошибка в одновременном нахождении на схеме Днепропетровска и Екатеринослава в 1920-е годы с различными значениями численности населения, поскольку это один и тот же город с разными названиями. Название Нижнего Новгорода в советские времена было Горький... , и тд.