Thursday, 15 December 2016

Цитируемость ведущих публикаций 2016 г. по альтметрикам

Я настолько давно ничего здесь не писал, что даже представители конкурентов уже подходят на конференциях и спрашивают: в чём дело? Отвечаю: последние несколько месяцев я вручную перебирал 1400 высокоцитируемых публикаций российских авторов, чтобы наградить лучших из них на нашей ежегодной церемонии, которая прошла в позапрошлый четверг. Безумно приятно было презентовать нашу глобальную методологию определения высокоцитируемых авторов, перенесённую на Россию, чтобы в масштабах страны найти тех, кто публикует наиболее важные для сегодняшней мировой науки результаты исследований, ещё приятнее - лично жать руки лауреатам, нашедшим время для того, чтобы приехать на церемонию.



Исправляюсь. Вот, например, вышел позавчера список 100 самых громких научных публикаций 2016 года по показателю альтметрик. Замечательная презентация результатов: хочешь - читай публикации, хочешь - смотри картинки или показатели альтметрик, хочешь - фильтруй как вздумается, а хочешь - скачай исходные данные и анализируй. Ну что, давайте развлечёмся:

(Если вы пока не работали с расширенным поиском в Web of Science - смело прокручивайте вниз до "У нас получился список")
  1. Скачиваем файл для анализа топ-100 публикаций по альметрикам (Read More About This List => Get the Top 100 Dataset)
  2. Открываем его в Excel, находим столбец с DOI
  3. Сразу же справа от столбца DOI делаем пустую колонку, в каждую ячейку в этой колонке, кроме самой нижней, вносим слово OR.
  4. Выделяем оба столбца - DOI и с OR - и копируем их в буфер обмена (CTRL+C)
  5. Открываем Web of Science Core Collection, пишем в окне Advanced Search: DO=( , дальше жмём CTRL+V и в конце скопированного запроса добавляем закрывающуюся скобку - ). Мы только что сделали запрос по 100 DOI документов-лидеров по альтметрикам в 2016м году.
  6. Жмём "Search"
  7. ?????????
  8. PROFIT!!
У нас получился список из 81-й работы, индексируемой Web of Science Core Collection, с их показателями цитруемости. Легко видеть, что многие из них (как, например, лидирующая по альтметрикам публикация Барака Обамы в Journal of American Medical Association), хоть и цитируются в Web of Science, но не особенно активно, а некоторые - точно так же удостоены титула "высокоцитируемые работы" - напомню, это публикации, входящие в 1% самых цитируемых в своей предметной области. Таких по состоянию на сегодняшний день 20.

Увы, всего одна работа из этого списка была опубликована при участии российских авторов: это Observation of Gravitational Waves from a Binary Black Hole Merger, над которой трудились 1,01 килоавтора из сразу двух крупных коллабораций по астрофизике, из них 8 авторов - с физического факультета МГУ и ещё трое - из Института прикладной физики РАН в Нижнем Новгороде.

Зависимость между альтметриками 2016 года и показателями цитируемости очень слабая, с коэффициентом корреляции около 0,25. Для нашего случая это даже довольно много, учитывая, что показатели альтметрик - например, количество твитов или репостов в соцсетях и т.д. - могут начинать расти практически сразу после выхода публикации, в то время как цитирующие статьи надо сначала написать, затем - опубликовать (а перед написанием цитирующей статьи неплохо было бы ещё и провести собственно исследование). О взаимосвязи между показателями цитируемости и альтметриками есть десятки научных публикаций, и вот, простите за рекурсивность, ссылка на самую цитируемую из них. Давайте лучше посмотрим, у каких публикаций совпали высокие показатели альтметрик и цитируемости, картинка ниже увеличивается при нажатии.



Что сразу бросается в глаза - это количество публикаций о вирусе Зика, а также то, что та самая публикация по астрофизике с участием российских авторов оказывается на первом месте.

Теперь - выборочно четыре из четырнадцати публикаций, которые по альтметрикам оказались в топ-100, но до сегодняшнего дня в Web of Science Core Collection не были процитированы ни разу - комментировать не буду, заголовки говорят сами за себя:


Признаюсь, я не очень активно интересовался альтметриками до этого, но после такого вот несложного наблюдения напрашивается следующий вывод: если цитируемость публикации указывает на её важность, авторитетность и влиятельность именно в научных кругах, то альтметрики, помимо весьма приблизительной оценки востребованности публикации научным сообществом, дают также картину популяризации результатов исследования. Это - очень и очень хорошо, учитывая, что недопопуляризация - одна из основных проблем сегодняшней науки, наравне со сложностями её финансирования, рецензирования научных публикаций, бюрократизацией и некоторых других трудностей, если судить по результатам опроса учёных, сделанного три месяца назад порталом The Vox.

Monday, 4 July 2016

Российские журналы в Journal Citation Reports'2016

Пару недель назад вышла очередная ежегодная редакция Journal Citation Reports, где доступны свежие импакт-факторы научных журналов, индексируемых в Web of Science Core Collection. Становится традицией, что каждый год я делюсь интересными наблюдениями о том, что происходит там с импакт-факторами российских журналов.

Количество российских изданий, имеющих заветный показатель, на этот раз уменьшилось на один. По сути, это гораздо больше связано со сменами журналами своих прописок (например, Laser Physics и Laser Physics Letters, которые, насколько я понимаю, перешли под крыло IOP и теперь считаются скорее английскими). Новичок из России в этом году один - это Russian Journal of Herpetology, который издаётся с 1993 года и индексируется в Web of Science Core Collection с начала 2013 г.

Два издания, сильнее всех прибавивших в плане импакт-фактора - это Russian Chemical Reviews, переводная версия "Успехов Химии" (было 2,318, стало аж 3,678), и уже упоминавшийся в прошлогоднем обзоре Acta Naturae (было 1, стало 1,77).

Много это или мало? Само по себе значение импакт-фактора мало о чём говорит, ведь если в области клеточной биологии импакт-фактор, равный трём - это журнал довольно средний, то в области, например, прикладной математики существуют всего два издания с импакт-фактором 3. Именно поэтому гораздо важнее позиция, которую занимает журнал в своей предметной области - или, говоря более грубо, в какой квартиль по импакт-фактору в своей области знания он входит.

Учитывая вышесказанное, довольно эфемерное выражение "журнал с высоким импакт-фактором" обретает куда больший смысл, если уточнить: "журнал, входящий в первый квартиль по импакт-фактору в своей предметной области". Тут есть чёткие значения для каждой предметной области, все они рассчитываются в Journal Citation Reports, и таких изданий первого квартиля в России всего три:

Три ведущих российских научных журнала, входящих в первый квартиль
по импакт-фактору в своих предметных областях
Что ещё заметно по российской научной периодике в Web of Science - это то, что абсолютное большинство публикаций сделано собственно российскими учёными. Вот визуализация страновой принадлежности организаций, чьи авторы публиковались в десяти ведущих (опять же, по импакт-фактору) российских журналах за последние 5 лет, все изображения, как обычно, увеличиваются по клику:

Страновая принадлежность авторов публикаций
в десяти ведущих российских журналах за последние 5 лет.
Визуализация из Thomson Reuters InCites
Нет, было бы странно, если бы на первом месте по публикационной активности в отечественных журналах были американцы или французы, но посмотрите, к примеру, на аналогичную разбивку по страновой принадлежности авторов у одного из ведущих китайских журналов Light-Science and Applications (импакт-фактор 13,6 - это второе место среди 90 журналов по оптике в Web of Science) - заметно, что процент иностранных авторов и соавторов значительно выше:

Страновая принадлежность авторов публикаций
в журнале Light-Science and Applications за последние 5 лет.
Визуализация из Thomson Reuters InCites
Тут надо заметить, что проблемы, похожие на наши - засилье публикаций учёных своей страны в национальных журналах - есть и в Бразилии, правда, для ведущих бразильских изданий эта проблема всё же стоит не так остро.

В разделе "лёгкие здорового человка" я не буду мучать вас аналогичной разбивкой по журналам Nature, Science или PLoS One, давайте лучше посмотрим на Tetrahedron, просто сильный журнал второго квартиля по органической химии с импакт-фактором 2.645:

Страновая принадлежность авторов публикаций
в журнале Tetrahedron за последние 5 лет.
Визуализация из Thomson Reuters InCites
Этим я хочу показать, что фокус на интернационализацию авторского состава - это одна из возможных стратегий для российских журналов, желающих качественно поднять себе импакт-фактор. Больший приток публикаций от иностранных авторов - это возможность более строгого отбора материалов, который, в свою очередь, должен повысить качество статей, попадающих на страницы журнала - а это уже бОльшие аудитории, дополнительные цитирования, новые подписки среди иностранных научных организаций - и, как следствие, рост импакт-фактора и престижа журнала.

На всякий случай, обзоры предыдущих лет:
2015
2014

Monday, 25 April 2016

Эффективность VS формализм в управлении научными исследованиями

Если вы уже какое-то время читаете этот блог, то наверняка знаете, что такое средняя цитируемость, нормализованная по предметной области относительно среднемирового уровня (category normalized citation impact, CNCI). Есть ещё один интересный показатель, о котором я до сих пор особенно не рассказывал - это средняя цитируемость, нормализованная по журналу (journal normalized citation impact, JNCI). Он показывает, насколько лучше или хуже, чем в среднем по журналу (а не по миру, как CNCI), цитируется научная публикация.

Сам по себе индикатор JNCI мало о чём говорит, но как дополнение к показателю CNCI он позволяет понять, в тех ли журналах публикуется рассматриваемый автор или организация. Ещё 5 лет назад мы обратили внимание на тот факт, что для абсолютного большинства российских научных организаций показатель CNCI существенно ниже единицы, которая и является среднемировым уровнем, а вот тот же показатель, но на уровне журнала - вполне на среднем уровне или даже выше него, все картинки кликабельны.

Показатели CNCI (единица - среднемировой уровень) и JCNI
(единица - средний уровень по журналу) у десяти наиболее
активно публикующихся российских организаций в период
с 2005 по 2014 гг. Скриншот из InCites
О чём это говорит? О том, что проблема низкой цитируемости российской науки (а тот же показатель CNCI для России в целом за последние 10 лет равен 0,65 - то есть, на 35% ниже среднемирового значения, - и по нему мы занимаем 136-е место среди 143х стран, которые
опубликовали за эти 10 лет хотя бы 1000 работ) - это результат не низкого качества самих публикаций. Проблема, как следует из этих наблюдений - в журналах, и если понимать, сколько человек во всём мире читает научную периодику, в которой больше всего любят публиковаться российские авторы, то прослеживается достаточно явная связь между размером аудитории журнала и цитируемостью работ.

Теперь перейдём к чуть более сложным вещам. В 2014м году на конференции Science Online заместитель директора библиотеки ВШЭ и по совместительству один из лучших наукометристов в России Владимир Писляков представил идеальный способ визуализации описанного выше наблюдения: мы можем отложить на графике значения JNCI на одной оси, а значения CNCI - на другой.



Получается вот такой красивый график. Поместить на него мы теперь можем всё, что угодно - индивидуальные публикации, средние значения этих показателей для конкретных авторов, университетов или даже стран. Биссектриса здесь делит график на две части и буквально показывает, где цитируемость, нормализованная по журналу, равна цитируемости, нормализованной по предметной области: сильное отклонение от неё вниз и вправо будет с высокой вероятностью говорить о том, что низкоимпактовый журнал "тянет" цитируемость публикаций вниз, сильное отклонение вверх и влево - о том, что автору повезло опубликовать статью в журнале, уровень которого сильно превышает уровень статьи, и таким образом поддерживает её цитируемость. Давайте попробуем отложить на этом графике российские научные организации.

Соотношение нормализованной цитируемости у наиболее активно
публикующихся российских университетов. Источник:
Thomson Reuters InCites

Это - российские университеты, размер кружка - количество публикаций. Здесь и далее окно публикационной активности взято с 2005го по 2014й год. Как видно, основная масса оказывается именно снизу-справа от биссектрисы, то есть - публикуются преимущественно в низкоимпактовых журналах, и абсолютное большинство из университетов в целом цитируется хуже среднемирового уровня. Самый большой кружок - это, разумеется, МГУ, у трёх ВУЗов - МИФИ, СФУ и ВШЭ - ситуация с цитируемостью оказалась даже лучше среднемировой.

Теперь давайте посмотрим на российские исследовательские институты.

Соотношение нормализованной цитируемости у наиболее активно
публикующихся исследовательских институтов. Источник:
Thomson Reuters InCites

С институтами ситуация очень похожая - здесь абсолютно все проявили себя на уровне журнала лучше, чем в мировом масштабе.

Что мы увидим у ведущих мировых научных организаций? Тут, как видите, пришлось продолжить ось CNCI вверх, чтобы Гарвард и MIT уместились на графике. С ними всё понятно - публикуются в лучших журналах, да ещё и на фоне самих журналов отлично выглядят.

Соотношение нормализованной цитируемости у
ведущих 
мировых университетов. Источник:
Thomson Reuters InCites

Интересная картина - у лидеров оставшейся части BRIC, исключая Россию. Обратите внимание, что масштаб диаграммы другой, её пришлось увеличить, чтобы разглядеть, поскольку все организации - довольно близко к центру. Видно, что университет Сан-Паулу смотрится чуть хуже других, но, на самом деле, несильно отклоняется от биссектрисы.


Соотношение нормализованной цитируемости у ведущих научных
организаций BRIC. Источник: Thomson Reuters InCites

Это было сравнение организаций. Очевидно, что более высокорейтинговые почему-то действительно оказываются выше и немного левее на графике. А вот теперь действительно интересные вещи. Что будет, если взять одну конкретную научную организацию и отложить на такой же диаграмме все их публикации в разбивке по журналам?

Начнём, пожалуй, с Университета Лобачевского - тем более что Евгений Владимирович Чупрунов, ректор Университета, на семинаре проекта "5top100" в Нижнем Новгороде в сентябре прошлого года сказал: "У нас рост публикационной активности происходит за счёт хороших журналов с хорошим импакт-фактором", - что было просто музыкой для моих ушей. Напомню, окно публикационной активности ограничено 2005м-2014м годами, то есть, периодом до того, как Евгений Владимирович озвучил это заявление.

Соотношение нормализованной цитируемости у Университета
Лобачевского. Источник: Thomson Reuters InCites
Цифры в скобках - это место, которое журнал занимает по импакт-фактору среди остальных изданий в своей предметной области. К сожалению, видно огромное количество хороших публикаций, которым мировой научное сообщество уделило очень мало внимания, и пара высокоимпактовых жуналов - увы, только по физике - в которых публикации цитировались слабо по меркам журнала и сильно по меркам всего мира. Давайте посмотрим на какой-нибудь академический институт - например, Институт Теоретической Физики им. Ландау:

Соотношение нормализованной цитируемости у ИТФ им. Ландау.
Источник: Thomson Reuters InCites

Снова прекрасно видно, что чем выше в своей предметной области журнал по импакт-фактору - тем лучше цитируются работы, и приятно видеть, что удачный выбор журналов (и, безусловно, ценнейшие результаты научных исследований) не ограничиваются сериями Physical Review/Physical Letters. Остались сомнения? Давайте посмотрим на лёгкие здорового человека аналогичную диаграмму для шести самых популярных журналов в Гарварде:

Соотношение нормализованной цитируемости у Гарварда. Источник:
Thomson Reuters InCItes.

Ну и какие выводы из этого мы делаем.

Первый: формализм в управлении научными исследованиями - плохо. Призывы "публиковаться только в индексируемых ведущими международными базами данных изданиях" - и особенно оценка деятельности по валу таких публикаций - заставляет многих учёных выбирать путь наименьшего сопротивления и публиковаться там, где проще, но при этом аудитория у таких изданий составляет не более тысячи человек. Это действительно увеличивает публикационную активность, но снижает цитируемость, по которой у России дела обстоят и вправду плохо.

Второй: решение "Мы добавим 5 наших журналов в ведущие международные базы данных" - верный способ потерять драгоценное время, и к 2020му году не то что не попасть ни в какие рейтинги, а испортить себе все основные показатели, связанные с цитируемостью. Оставьте инициативы по продвижению журналов редакциям самих журналов.

Третий: любая инициатива, смещающая акцент в управлении научными исследованиями с более активного и креативного продвижения научных результатов (которым, как правило, является научная публикация) на агрессивное продвижение научных журналов, гарантированно затягивает цитируемость научных исследований вот в этот квадрант:



Отдельное спасибо за подготовку этого материала моему коллеге и другу Сергею Парамонову, который уже добавил эту методологию к тем консалтинговым проектам, которые он реализовывает для российских организаций.

Monday, 18 April 2016

Russian Science Citation Index

Ежедневно мы получаем огромное количество писем с вопросами о нашей новой базе данных Russian Science Citation Index, а это значит, что самое время написать отдельный текст с ответом на основные из них.

Зачем вообще понадобилась новая база данных?

Во-первых, для того, чтобы у нас с вами появилась возможность оценивать российскую науку по ещё более репрезентативной выборке. В нашей центральной базе данных Web of Science Core Collection критерии отбора журналов настолько жёсткие, что сейчас им отвечает порядка 160и российских журналов. Существует эта политика отбора в первую очередь для того, чтобы по цитируемости в принципе можно было оценивать науку - иначе как можно оценить влиятельность научной статьи, если одно цитирование на неё идёт из Nature, а остальные десять - из условного "Вестника N-ского Гуманитарно-Строительного Университета"?

Разумеется, наукометрический анализ необходимо проводить по достаточно однородному массиву данных. Web of Science Core Collection, таким образом, формирует высшую лигу мировых журналов, а база Russian Science Citation Index - "первую", в которой собраны журналы, прошедшие хорошо продуманную трёхэтапную (третьим этапом было публичное обсуждение итоговых списков) процедуру отбора, организованную Научной Электронной Библиотекой eLibrary.ru - и, вдобавок, чуть лучше покрывающие отдельные предметные области в России.

Во-вторых, новая база нужна для продвижения успехов российской науки за рубежом. Количество пользователей Web of Science во всём мире уже превышает 30 миллионов, и теперь каждый из них может при поиске находить публикации из Russian Science Citation Index - даже если поиск был сделан на английском языке, поскольку данные каждой публикации дублируются на английском и русском:


Таким образом, любой научный сотрудник, организация или издательство, пока не представленные в Web of Science Core Collection или представленные там скромно, могут использовать Russian Science Citation Index и для того, чтобы доказать важность своих научных результатов, и для того, чтобы более активно информировать о них мировую научную общественность.

У нас был доступ до конца февраля 2016 года, а потом пропал. Когда вы включите его обратно?

С декабря по февраль мы действительно открывали в России всем подписчикам Web of Science доступ к новой базе данных - даже не на бесплатный тест, в общепринятом понимании подписных баз данных, а на вариант бета-тестирования, чтобы собрать информацию о возможных проблемах и ошибках, исправить их и быть готовыми к запуску базы во всём мире в конце марта. Сам же доступ предоставляется за куда меньшую, чем у Web of Science Core Collection, но абонентскую плату.

Что это за дискриминация?

Тоже очень правильный вопрос: почему Thomson Reuters предлагает подписку на Russian Science Citation Index в России за деньги? Действительно, большинство региональных указателей устроены совсем по-другому: либо на весь мир они открываются бесплатно (как Korean Citation Index или латиноамериканская база SCIELO), либо для самой страны она делается доступной бесплатно, а для остального мира - за абонентскую плату (как в случае с Chinese Science Citation Database).

Здесь надо оговориться, что проекты региональных указателей цитирования, как правило, инициируются локальными организациями - например, в Китае это была местная Академия Наук - они же и финансируют проект создания базы. В России найти спонсора подобного проекта нам, к сожалению, не удалось, и мы пошли на некоторый риск, профинансировав разработку базы данных из средств Thomson Reuters, а поскольку мы - компания коммерческая, подобные затраты нам необходимо хотя бы в минимальном виде окупать.

Тогда почему же, спросит внимательный читатель, мы сделали базу данных бесплатной для остального мира? Это было нужно для того, чтобы выполнить вторую задачу проекта - продвижение российских научных результатов в мировое научное сообщество, а для этого важно, чтобы и у профессора в Токио, и у аспиранта в Сан-Паулу, и у проректора в Париже этот доступ появился без необходимости каких-либо дополнительных телодвижений.

Я нашёл в базе данных неточность. Кому об этом сообщить?

Правильнее всего будет обратиться в нашу службу поддержки, сделать это можно прямо из интерфейса Web of Science, воспользовавшись функцией "Suggest a correction" (в русском варианте - "Предложить поправку"):


Где взять список журналов Russian Science Citation Index?

Самый свежий список на момент написания этого текста находится по этой ссылке

У меня остались вопросы. Кому написать?

Напишите мне, адрес моей электронной почты - вверху страницы.

Wednesday, 16 December 2015

Цитируемость классиков русской литературы в базе данных Web of Science Core Collection

Вот уже более 50 лет база данных, созданная Юджином Гарфилдом, помогает учёным со всего мира определять влиятельность научных публикаций на основании их цитируемости другими научными работами. За эти более чем полвека Web of Science превратилась из инструмента для проведения научных исследований в мощный ресурс для оценки их результативности, применяемого правительствами, научными фондами и руководством исследовательских организаций для понимания тенденций в научных исследованиях, принятия решений об их развитии и финансировании.

При этом, исходная функция указателя научной цитируемости Web of Science – анализ цитатных связей между публикациями – представляет собой исследовательскую ценность, позволяя не только количественно оценить вклад в науку, сделанный той или иной научной статьёй, но и качественно отследить влияние научных идей на контекст последующих научных исследований.

Поскольку база данных Web of Science Core Collection индексирует все списки используемой литературы для всех индексируемых публикаций, у нас есть возможность не только увидеть, как результаты одних научных исследований, индексируемых в Web of Science, цитируются другими, тоже индексируемыми в Web of Science, но и оценить, как в этой базе данных цитируются материалы, которые в ней отсутствуют – например, чья-нибудь диссертация – или статья в журнале, который в силу строгости критериев отбора Web of Science не представляет для базы данных интереса – или, например, «Божественная Комедия» Данте Алигьери или «Война и Мир» Льва Толстого.

Научный мир в буквальном смысле «заболел» различного рода рейтингами: университетскими, страновыми (как публикуются и цитируются научные сотрудники в конкретной стране – очень достоверный и прозрачный способ оценить качество организации исследований), списками высокоцитируемых учёных (вы знали, что именно они и получают Нобелевские премии и так далее. В этой связи российская команда Thomson Reuters Intellectual Property & Science уже не первый год задавалась двумя вопросами: кто же из классиков литературы – самый цитируемый и как их литературные шедевры повлияли на ход научных исследований XX-XXI веков?

Анализ пристатейных списков используемой литературы подразумевает существенно больше ручной работы, чем подсчёт «классического» цитирования публикаций, уже индексируемых в Web of Science, которое происходит автоматически, поэтому мы довольно долго думали о том, с какой стороны подступиться к проблеме и как создать достаточно репрезентативную выборку писателей, иными словами – где провести черту между «классиками» и «неклассиками». За это время в России наступил год литературы, мы поняли, что начать можно с классиков русской литературы и что действовать надо сейчас или никогда. За основу была взята школьная программа по литературе, затем мы дополнили её ещё несколькими фамилиями вроде Пелевина, Сорокина и «не совсем русского» Набокова, после чего приступили к ручному поиску, фильтрации и подсчёту количества ссылок на различные их произведения при помощи функции Cited Reference Search, то есть, поиска по тем самым пристатейным библиографиям в Web of Science Core Collection.

Рейтинг авторов

Мы вручную отфильтровали однофамильцев с похожими инициалами, учли ссылки на большом количестве иностранных языков, вроде «KARAMAZOV NO KYODAI» по-японски или «GUERRA E PAZ» по-португальски. Имеет ли смысл в данном случае стремиться к 100%-ной достоверности итоговых результатов? Мы считаем, что нет, оцениваем погрешность измерений не более чем в 5%, более того – даже решили округлить результаты, отчего итоговый рейтинг стал только нагляднее. Ниже мы приводим рейтинг авторов.

1. Федор Достоевский (7 800 цитирований)
2. Лев Толстой (6 400)
3. Александр Пушкин (5 200)
4. Александр Солженицын (3 500)
5. Антон Чехов (3 100)
6. Николай Гоголь (2 350)
7. Иван Тургенев (2 250)
8. Максим Горький (2 100)
9. Осип Мандельштам (1420)
10. Делят, как ни странно, Анна Ахматова и Марина Цветаева (по 1350 ссылок)

Оценив цитируемость русских писателей, мы всё же не смогли обойти стороной иностранных классиков, чтобы хоть как-то сопоставить их влияние в научных кругах. Как уже упоминалось в начале отчёта, из-за обилия ручной работы анализ писателей всего мира, которых с определённой долей уверенности можно отнести к «классикам мировой литературы», займёт существенно больше времени и заслуживает проведения отдельного исследования, тем не менее, мы создали минимально возможную референтную группу из Шекспира, Данте Алигьери и Гёте, и вот что у нас получилось:

Шекспир: 34 000
Гёте: 18 000
Данте: 11 500

Важно отметить, что большинство (хотя и не все) расписываемых в Web of Science Core Collecction научных журналов, книг и материалов конференций выходят на английском языке. Это связано с тем, что международным языком науки является английский, поэтому ещё раз отметим – это исследование сопоставляет не величие писателей, а лишь их влияние на контекст мировой науки.

Рейтинг произведений

Если быть предельно кратким, то три самых высокоцитируемых произведения русских классиков – это «COMPLETE WORKS», «POLNOE SOBRANIE SOCHINENII» и «PSS». Это - основной фактор, «загрязняющий» итоговые результаты, и он является следствием того, как оформляются ссылки на работы в научных журналах. Очень часто цитирующий автор указывает не название собственно произведения, а название источника, год выпуска и номер страницы, на которой находится цитируемый текст. Больше всего от этого «страдают» стихотворения, которые чаще, чем объёмная проза, выходят в сборниках, но не настолько, чтобы в итоговом рейтинге работ стихотворных произведений не было. Ниже мы приводим 20 русских классических произведений, оставивших самый заметный след в мировых научных исследованиях:

1 Братья Карамазовы          1319
2 Война и Мир                        942
3 Анна Каренина                    743
4 Преступление и Наказание      663
5 Евгений Онегин                    620
6 Записки из Подполья                  496
6 Идиот                                496
8 Архипелаг ГУЛАГ*                399
9 Доктор Живаго                       374
10 Смерть Ивана Ильича                373
11 Бесы                                  360
12 История Государства Российского* 352
13 Мастер и Маргарита              302
14 Мёртвые Души                         299
15 Вишнёвый сад                         213
16 Чайка                                  211
17 Отцы и дети                                       203
18 Ревизор                               186
19 Дядя Ваня                           160
20 Герой Нашего Времени                  152

След русских классиков в мировой науке

Вот некоторые интересные наблюдения, которые нам удалось сделать на основании более детального анализа цитируемости отдельных произведений Льва Толстого и Достоевского.

Их произведения, как и большинство прочих, активнее всего цитируются в области социогуманитарных наук: искусствоведами, историками, лингвистами и так далее. Тем не менее, эти работы оказывают влияние и на современные исследования в области естественных наук.

На изображении представлена разбивка публикаций, цитирующих «Братьев Карамазовых», по предметным областям, взятая из аналитического инструмента Thomson Reuters InCites. Интересно, что произведение цитируется, хотя и довольно скромно, публикациями в области химии. И если одна из них использует текст из «Братьев Карамазовых» в качестве эпиграфа[1], что не несёт в себе существенной научной ценности, то вторая – «Protein sequences as literature text», написанная при непосредственном участии проректора МГУ Алексея Ремовича Хохлова – использует текст «Братьев Карамазовых» для проверки методики анализа повторяющихся сегментов в белках[2]. Также очевидно, что произведения Достоевского дали значительный материал для работы нейробиологов, психологов и психиатров во всём мире.



Цитируемость Достоевского психологами, психиатрами и нейробиологами - пожалуй, наиболее заметный след российских писателей в мировой науке. Более сотни публикаций в Web of Science – в свою очередь, процитированные не одну тысячу раз – ссылаются на произведения Достоевского в контексте анализа как симптомов эпилепсии у персонажей его произведений, болезни самого автора и взяимосвязи между недугом у автора и его героев[3,4,5,6].

Интересно выглядит разбивка по предметным областям публикаций, цитирующих «Войну и Мир». 77 цитирующих работ по истории были, в свою очередь, процитированы более 400 раз, что подтверждает огромную ценность «Войны и Мира» для историков. Примечательно, что две из трёх математических статей, ссылающихся на произведение Льва Николаевича, целиком и полностью посвящены математическим метафорам Льва Толстого, приведённым в четвёртом томе «Войны и Мира»[7,8].



Знаменитая фраза «Все счастливые семьи похожи друг на друга, каждая несчастливая семья несчастлива по-своему» из «Анны Карениной» настолько часто используется (как правило, очень к месту) в ряде исследований по естественным наукам, иногда – в несколько переработанном виде, например, «Ordered structures are all alike; every disorder class is disordered in its own way»[9], что в одной из публикаций получила статус официального научного термина - «Anna Karenina principle»[10].

Заключение

Помимо развлекательной цели, которую мы преследовали – составление рейтинга цитируемости российских писателей и поэтов и проведение самого поверхностного сопоставления их показателей с аналогичными показателями иностранных классиков, мы хотели понять, оказали ли их работы влияние на последующие научные исследования в мире и можем ли мы измерить это влияние. Несмотря на то, что значительная часть цитирований на эти работы приходит из литературных обзоров, нам удалось увидеть, что шедевры литературы нередко используются учёными не только в области истории (если книга повествует о событиях исторической важности) или поведенческих наук (для которых, как правило, ценность представляет драматургия). Тексты этих книг используются и как эпиграфы к статьям, и как массивы данных для проверки алгоритмов, а отдельные фразы могут иметь достаточно значимости для науки, чтобы превратиться в распространённый научный термин. Наконец, в исключительных случаях научное содержание произведений может цитироваться в точности так же, как и полноценные научные труды.

Ссылки

1.        Salomone, A. et al. Direct observation of a lithiated oxirane: a synergistic study using spectroscopic, crystallographic, and theoretical methods on the structure and stereodynamics of lithiated ortho-trifluoromethyl styrene oxide.Chemical Science 5, 528-538, doi:10.1039/c3sc52099d (2014).
2.  Vasilevskaya, V. V., Gusev, L. V. & Khokhlov, A. R. Protein sequences as literature text. Macromolecular Theory and Simulations 15, 425-431, doi:10.1002/mats.200600003 (2006).
3.      Stefan, H. et al. Ictal pleasant sensations: Cerebral localization and lateralization. Epilepsia 45, 35-40, doi:10.1111/j.0013-9580.2004.09303.x (2004).
4.      Picard, F. & Craig, A. D. Ecstatic epileptic seizures: A potential window on the neural basis for human self-awareness.Epilepsy & Behavior 16, 539-546, doi:10.1016/j.yebeh.2009.09.013 (2009).
5.      Paredes, R. G., Muzzi, G., Aguirre, E. & Romero, V. Can a generalized kindling seizure induce a reward state? Epilepsy Research 38, 249-257, doi:10.1016/s0920-1211(99)00101-1 (2000).
6.      Baumann, C. R., Novikov, V. P. I., Regard, M. & Siegel, A. M. Did Fyodor Mikhailovich Dostoevsky suffer from mesial temporal lobe epilepsy? Seizure-European Journal of Epilepsy 14, 324-330, doi:10.1016/j.seizure.2005.04.004 (2005).
7.       Ahearn, S. T. Tolstoy's integration metaphor from war and peace. American Mathematical Monthly 112, 631-638 (2005).
8.      Vitanyi, P. M. B. Tolstoy's Mathematics in War and Peace. Mathematical Intelligencer 35, 71-75, doi:10.1007/s00283-012-9342-8 (2013).
9.      Novikov, D. S., Jensen, J. H., Helpern, J. A. & Fieremans, E. Revealing mesoscopic structural universality with diffusion.Proceedings of the National Academy of Sciences of the United States of America 111, 5088-5093, doi:10.1073/pnas.1316944111 (2014).

10.   Holmes, I., Harris, K. & Quince, C. Dirichlet Multinomial Mixtures: Generative Models for Microbial Metagenomics. Plos One 7, doi:10.1371/journal.pone.0030126 (2012).