My-library.info
Все категории

Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

На электронном книжном портале my-library.info можно читать бесплатно книги онлайн без регистрации, в том числе Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры. Жанр: Научная Фантастика издательство АСТ, год 2004. В онлайн доступе вы получите полную версию книги с кратким содержанием для ознакомления, сможете читать аннотацию к книге (предисловие), увидеть рецензии тех, кто произведение уже прочитал и их экспертное мнение о прочитанном.
Кроме того, в библиотеке онлайн my-library.info вы найдете много новинок, которые заслуживают вашего внимания.

Название:
Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
Издательство:
АСТ
ISBN:
978-5-17-088935-8
Год:
2016
Дата добавления:
20 август 2018
Количество просмотров:
262
Читать онлайн
Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры краткое содержание

Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - описание и краткое содержание, автор Жан-Батист Мишель, читайте бесплатно онлайн на сайте электронной библиотеки My-Library.Info
Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры читать онлайн бесплатно

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - читать книгу онлайн бесплатно, автор Жан-Батист Мишель

Но так было недолго. Использование дентального суффикса для обозначения прошедшего времени оказалось невероятно успешным изобретением, которое получило широкое распространение. Подобно любой другой революционной технологии, новое правило стало понемногу распространяться и применяться лишь в отношении отдельных забавно звучащих глаголов, с которыми не мог справиться аблаут. Однако раз начавшись, этот процесс уже не остановился. Простой и запоминающийся дентальный суффикс начал привлекать все больше приверженцев, поскольку все чаще изменения касались глаголов, прежде использовавших аблаут.

Таким образом, к моменту создания классического староанглийского текста «Беовульф» (примерно 1200 лет назад) более трех четвертей английских глаголов изменялись по новому правилу. После того как у старого аблаута иссякли силы, новое правило с суффиксом – ed стало его повсюду вытеснять. В течение следующей тысячи лет исчезло огромное количество неправильных форм глаголов. Тысячу лет назад я мог бы holp (от глагола help – «помогать») вам. А вот вчера моя помощь вам описывалась бы словом helped.

Сегодняшние лингвисты, глядя на этот процесс в исторической ретроспективе, объясняют его термином «выравнивание». Нужно отметить, что процесс продолжается и сейчас. Рассмотрим глагол thrive («процветать»). Около 80 лет назад заголовок в газете New York Times гласил: Gambling Halls Throve in Billy Busteed’s Day («Игровые залы процветали в день Билли Бастида»). А в 2009 году в разделе «Наука» той же газеты была опубликована статья под заголовком Some Mollusks Thrived After Mass Extinction («Некоторые моллюски процветают после массового уничтожения»). Форма глагола throve (в отличие от этих удачливых моллюсков) пала жертвой массового истребления аблаутов. И пути назад нет. Став правильными, глаголы почти никогда не превращаются в неправильные[61].

Подобно тремстам спартанцам в Фермопилах, английские неправильные глаголы – эти триста смелых – решительно устояли в безжалостной борьбе, начавшейся против них в 500 г. до н. э. Они вели бой каждый день, в каждом большом и малом городе, на каждой улице, где говорят по-английски. Они отрабатывали навыки выживания в течение 2500 лет. И поэтому они – это не просто исключения. Их можно считать оставшимися в живых счастливчиками.

И процесс, благодаря которому они выжили, мы как раз и намеревались изучить – процесс эволюции языка.

2005: Еще одна одиссея данных

Почему же некоторые неправильные глаголы умерли, а другим удалось выжить? Почему глаголу throve (от глагола thrive – «процветать») не удалось выжить, а глаголу drove (от глагола drive – «ехать») – удалось? [62]

У лингвистов уже есть несколько отличных идей относительно того, почему неправильные глаголы имеют столь высокую частотность. Они предположили, что чем меньше мы сталкиваемся с неправильным глаголом, тем сложнее его запомнить и тем проще забыть[63]. Вследствие чего редкие неправильные глаголы вроде throve исчезают быстрее, чем частые, вроде drove. Со временем неправильные глаголы с низкой частотой употребления полностью исчезали, а неправильные глаголы как группа становились более частыми.

Эта гипотеза показалась нам в высшей степени интересной, поскольку предполагала, что неправильные глаголы проходят через определенный процесс, аналогичный эволюции, путем естественного отбора[64]. Почему неправильные глаголы встречаются настолько часто, когда, в полном соответствии с законом Ципфа, во всех остальных лексических классах доминируют редкие слова? Потому что естественный отбор, в форме ненасытного правила – ed, обеспечивает простым неправильным глаголам эволюционное преимущество. Чем чаще глагол используется, тем выше его шансы на выживание.

Созданный Ципфом «компас» был на тот момент самым идеальным примером естественного отбора, действующего в человеческой культуре, с которым нам только доводилось сталкиваться. Компас Ципфа указал нам на увлекательную проблему: может ли сформироваться лингвистическое чутье при столь тщательном изучении материала? Это могло бы стать простой, но доходчивой иллюстрацией того, что человеческая культура способна развиваться путем естественного отбора. Теперь нам, как и Ципфу, требовалось лишь найти подтверждение.

Для помощи в поисках мы привлекли к работе двух невероятно талантливых старшекурсников Гарвардского колледжа, Джо Джексона и Тину Тан. В идеале мы надеялись, что Джо и Тина смогут прочитать все источники, когда-либо опубликованные на английском языке, и записать каждый пример неправильного глагола, с которым они сталкивались. Однако оба они сказали нам, что все же хотели бы поработать над своими дипломами (для нас как аспирантов это уже был пройденный и забытый этап). Для решения задачи нам пришлось импровизировать.

К счастью, Джо и Тина учли историю Ципфа, поэтому предложили альтернативный подход. Вместо того чтобы читать абсолютно все, почему бы не ограничиться учебниками по истории английской грамматики? Грамматические тексты, относящиеся, скажем, к средневековому английскому языку, наверняка касались бы вопроса неправильных глаголов и упоминали бы многие из них. Не исключено, что где-то можно было найти и список таких глаголов. Изучив в библиотеке каждый учебник, посвященный истории английского языка различных периодов, мы могли получить довольно точную картину того, какие глаголы считались неправильными и когда[65]. Учебники могли бы дать нам то же самое, что дало Ципфу проведенное Хенли исследование «Улисса».

Разумеется, сказать проще, чем сделать. Джо и Тина посвятили несколько месяцев кропотливой работе, читая учебники древнеанглийского языка (языка «Беовульфа», на котором говорили примерно в 800 г. н. э.) и средневекового английского (языка Чосера, на котором говорили начиная примерно с XII столетия). Они нашли 177 староанглийских неправильных глаголов, развитие каждого из которых они смогли проследить на протяжении тысячи и более лет. Получив такую картину, мы наконец увидели, как менялся язык.

В древнеанглийском языке все 177 глаголов изначально были неправильными. К началу Средневековья, через четыре столетия, выжило лишь 145 неправильных форм; остальные 32 были приведены в соответствие с новыми нормами. В современном английском языке неправильными остались лишь 98. Остальные 79 глаголов до сих пор присутствуют в языке, однако, подобно глаголу melt («таять»), они изменили форму. При этом был заметен довольно примечательный дисбаланс. Из 12 наиболее часто встречающихся глаголов в нашем списке ни один не стал правильным – им удалось на протяжении 12 столетий сопротивляться давлению со стороны правила – ed. Нарушение пропорций шло и с другой стороны. Из 12 наименее часто использовавшихся глаголов в списке 11 стали правильными, в том числе bide («пребывать») и wreak («причинять»). Единственным выжившим неправильным глаголом с низкой частотой оказался slink («красться») – глагол, который как раз четко описывает этот тихий процесс исчезновения[66].


Жан-Батист Мишель читать все книги автора по порядку

Жан-Батист Мишель - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки My-Library.Info.


Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры отзывы

Отзывы читателей о книге Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры, автор: Жан-Батист Мишель. Читайте комментарии и мнения людей о произведении.

Прокомментировать
Подтвердите что вы не робот:*
Подтвердите что вы не робот:*
Все материалы на сайте размещаются его пользователями.
Администратор сайта не несёт ответственности за действия пользователей сайта..
Вы можете направить вашу жалобу на почту librarybook.ru@gmail.com или заполнить форму обратной связи.