In Soviet Russia, scientometrics conduct you

Monday 28 September 2020

Наши прогнозы лауреатов Нобелевской премии

В этом году нашему проекту Citation Laureates исполняется 18 лет и, несмотря на то, что присуждение Нобелевской премии будет из-за пандемии проводиться в несколько урезанном формате, для нас игра в предсказание победителей не становится менее интересной: 23 сентября наши списки Citation Laureates пополнились ещё двадцатью четырьмя именами выдающихся учёных.

В чём суть проекта: каждый год с 2002-го мы называем по нескольку фамилий тех учёных, чей вклад в науку тянет на заветную премию, и делаем это примерно за две недели до Нобелевской - которая, в свою очередь, проходит в начале октября. Каждый раз мы обязательно подчёркиваем в наших прогнозах: "это - не прогнозы лауреатов Нобеля на ближайший год", поскольку год присуждения премии предсказать практически невозможно (вот этот текст, который висит прямо в описании методологии).

Citation Laureates не должны считаться буквальными предсказаниями Нобелевской премии конкретного года - методология составления прогнозов

Логично, что успешным прогнозом является тот, который был сделан с момента старта проекта и впоследствии сбылся. Если говорить на сухом языке цифр, то по состоянию на конец 2019 года в наших списках Citation Laureates числились 336 фамилий (на сегодняшний день - уже 360, все списки доступны публично и абсолютно прозрачны), из них 54 прогноза сбылось, что равняется 16 процентам попадания. Таким образом, каждый год мы угадываем в среднем по три лауреата, и последние годы эта цифра заметно выше среднего - и тем более выше, чем в нулевых годах, когда проект только стартовал.

Методология - совсем вкратце

Что мы хотим показать этим проектом: что есть однозначная корреляция между высокой цитируемостью научной публикации и шансами её автора на получение такой престижной награды. Так, для проекта Citation Laureates мы отбираем все работы в Web of Science Core Collection, которые были процитированы не менее 1000 раз - таких по состоянию на лето этого года было более двадцати тысяч (подробнее о методологии отбора написано здесь - он не ограничивается сухим библиометрическим анализом, наши эксперты вычитывают сами работы и дополнительно анализируют контекст решений Нобелевского комитета).

Но, конечно, не весь этот массив публикаций с зашкаливающей цитируемостью относится к тем направлениям, за которые в принципе можно получить Нобелевскую премию. Собственно, и не каждую номинацию в принципе можно предсказать с помощью библиометрического анализа: разумеется, предсказание лауреатов премии по литературе и премии мира нам пока не по зубам, но оставшиеся четыре направления (физиология и медицина, физика, химия и экономика) - это благодатная почва для предсказаний при помощи Web of Science.

О том, какие учёные - и за какие заслуги - попали в наши списки Citation Laureates в этом году, я предлагаю вам почитать на странице проекта. В этом посте я хочу напомнить о самых интересных российских фамилиях, которые были в наших предыдущих прогнозах, но которые заслуживают гораздо большего внимания за несколько дней до Нобелевской недели.

За кого нам "болеть"?

В первую очередь, это два известных учёных, синхронно попавших в наши списки три года назад: это ведущий научный сотрудник Института химической физики (ИХФ) им. Н. Н. Семёнова РАН Георгий Борисович Шульпин и главный научный сотрудник Института космических исследований РАН, (а также - директор Института астрофизики общества Макса Планка) Рашид Алиевич Сюняев.

В 2017 году коллеги предсказали, что Георгий Шульпин должен получить Нобелевскую премию по химии - вероятнее всего, совместно с Джоном Беркоу из Калтеха и Робертом Бергманом из Беркли - за вклад в функционализацию углеродно-водородных связей. Можем ли мы оценить, как этот вклад измеряется сухим языком библиометрии? Нет проблем - вот публикация Георгия Борисовича, сделанная в декабре 1997 года - по состоянию на 28 сентября 2020 она собрала в Web of Science Core Collection аж 2339 цитирований, все изображения кликабельны.

Публикация 1997 года "Activation of C-H bonds by metal complexes" Георгия Борисовича Шульпина в Chemical Reviews и её цитируемость на конец сентября 2020 г

Рашид Сюняев (ссылка на сам прогноз - та же, что и у Георгия Борисовича), как мы считаем, должен получить Нобеля по физике за его "глубокий вклад в наше понимание Вселенной, включая ее происхождение, процессы образования галактик, дисковую аккрецию черных дыр и многие другие космологические явления". И действительно - в Web of Science Core Collection без труда можно найти 8 публикаций Рашида Алиевича с цитируемостью больше 1000, некоторые из которых сделаны в рамках крупных коллабораций вроде Planck Collaboration, но, пожалуй, наиболее важная из них по праву находится в самом верху списка с 9293 цитированиями. Именно она долгое время являлась наиболее цитируемой отечественной публикацией в Web of Science Core Collection, пока в начале десятых годов её не обогнала... "Electric field effect in atomically thin carbon films", "нобелевская" работа Андрея Гейма, Константина Новосёлова и других известных соавторов.

Публикация 1973 года "Black Holes in Binary-Systems - Observational Appearance" Рашида Сюняева в журнале Astronomy & Astrophysics и её цитируемость на конец сентября 2020 г.

Здесь я вынужден оговориться - конечно же, Нобелевскую премию присуждают не за конкретную статью, а за вклад в науку. Я привожу здесь лишь наиболее цитируемые публикации из соображений экономии места, поскольку не нашёл способа вставить в blogger удобочитаемый скриншот на 8 и более публикаций из Web of Science Core Collection

И ещё три интересных фамилии

Если как следует покопаться в списке Hall of Citation Laureates, в котором представлены все учёные, попадавшие в наши прогнозы с 2002 года, то можно найти ещё как минимум троих человек - увы, уже без российской аффилиации, но всё же с российскими или советскими корнями. Если пока вы не слышали этих фамилий, то вдвойне рад представить вам их.

Александр Юрьевич Руденский - директор Людвигского центра иммунотерапии рака в Мемориальном онкологическом центре Слоуна-Кеттеринга в Нью-Йорке. Вот ссылка на наш прогноз 2015 года - "за открытия, связанные с регуляторными Т-клетками". По состоянию на конец сентября 2020 Web of Science Core Collection видит 7 работ Александра Юрьевича с цитируемостью более 1000 (и, по всей видимости, скоро их будет уже 8), и тут особняком стоит вот эта.

Публикация 2003 года Александра Руденского в Nature Immunology и её цитируемость на конец сентября 2020 г.

Андрей Дмитриевич Линде - профессор Стэнфордского университета. Его награждение мы предсказывали аж в 2006 году. У Андрея Дмитриевича 5 публикаций в Web of Science Core Collection с цитируемостью, превышающей заветную планку, но интересно, что две самые цитируемые написаны им ещё в "достэнфордский" период научной карьеры и содержат только одну аффилиацию - это ФИАН.

Две из пяти наиболее цитируемых публикаций Андрея Линде в Physics Letters B и их цитируемость на конец сентября 2020 г.

Last but not least, Валерий Валерьевич Фокин. Предсказание было опубликовано в 2013 году с мотивировкой: "за развитие молекулярной клик-химии" (2013 год, надо отметить, был удачный на сбывшиеся прогнозы: именно тогда нами был предсказан Петер Хиггс, а также лауреаты 2019 года Мишель Майор и Дидье Кьело). Тогда основной аффилиацией Валерия Валерьевича был Институт Скриппса, но с 2015 года он работает в Университете Южной Калифорнии - что и подтверждается его аффилиациями в научных статьях. А вот и самая цитируемая из его публикаций (всего с цитируемостью более 1000 у него их сейчас тоже, как ни странно, 8).

Наиболее цитируемая публикация Валерия Фокина и её цитируемость на конец сентября 2020 г.

Резюмируя вышесказанное: фамилии, появившиеся в нашем списке Citation Laureates в прошлую среду - безусловно, выдающиеся учёные, сделавшие огромный вклад в современную науку, но часто хочется искренне желать победы кому-то более родному. И если принцип support your local team русскому человеку близок, то пусть эта local team в контексте Нобелевской премии состоит из фамилий Шульпин, Сюняев, Руденский, Линде и Фокин.

И всё?

Если эта история с прогнозами вам интересна, приглашаю вас посоревноваться в их точности - как я написал в самом начале, по состоянию на конец прошлого года она составляла у нас 16%. Нас иногда спрашивают - а есть ли у вас конкуренты в этом деле? Конечно, нельзя в шутку не упомянуть мультсериал "Симпсоны" и их эпизод Elementary School Musical, которые, если отбросить опечатку в имени Веры Рубин и того факта, что Оливер Вильямсон - не физик, а экономист (хотя, надо признать, впоследствии тоже получил Нобелевскую премию), идут с нами примерно вровень.

Конечно же, никто из нас не может знать наверняка, фамилии каких российских учёных могут быть на радаре у Нобелевского комитета прямо сейчас. Но смотрите, какое интересное упражнение можно сделать, если у вас будет соответствующий интерес и пара часов свободного времени:

1. Провести поиск в Web of Science Core Collection по всем публикациям России и СССР с типом документа "article" или "proceedings paper" за период с 1970 года

2. Отсортировать их по количеству цитирований

3. Исключить из результатов поиска мегаколлаборации

4. Остаётся чуть меньше 200 публикаций с более чем 1000 цитирований

Планка в 1000 цитирований - скорее психологическая, чем библиометрическая, но 200 оставшихся в результате документов - это не big data, их можно потрогать руками и посмотреть, кто их автор и почему они так хорошо цитируются. Кто знает, возможно, вам удастся таким образом найти российских авторов, не попавших в наши прогнозы, но чьё имя может прогреметь через неделю в Стокгольме.

Friday 6 September 2019

Немного о трендах в искусственном интеллекте

Нас часто спрашивают - ну а раз вы такие умные и умеете оценивать науку, расскажите нам, какие сейчас вообще тренды в научных исследованиях? Вот мы и решили попробовать. Месяц назад я не знал об искусственном интеллекте практически ничего, а вчера мы провели бизнес-завтрак для представителей некоторых российских корпораций, посвящённый тенденциям в области исследований искусственного интеллекта. Делюсь со всеми интересующимися оценкой науки - и персонально для вас, с бо́льшим уклоном в библиометрию, чем было сделано в моём вчерашнем докладе.

Начнём с динамики публикационной активности по теме "искусственный интеллект" (поиск по всем источникам Web of Science Core Collection, относящиеся к предметной области под названием "Computer Science, Artificial Intelligence"), все картинки увеличиваются при нажатии.

Динамика публикационной активности по предметному направлению "Computer Science, Artificial Intelligence" в мире и в России (значения для России - на вертикальной оси справа)

Интересно, что пика публикационной активности по теме ИИ было целых два: в 2006 году и в 2017, причём, если посмотреть только на российские публикации - то первый пик 2006 года мы как-то пропустили, зато в позапрошлогодний очень даже попали. Да - в 2018 году, по сути, был спад публикационной активности по искусственному интеллекту - что в России, что в мире. И да, мы попробовали поискать для вас восходящие тренды в сокращающейся предметной области. И нашли.

О чём же всё-таки пишут по теме ИИ за последнее время? Мы взяли 2178 высокоцитируемых публикаций по ИИ (напомню, высокоцитируемые - это те публикации, что были сделаны за последние 10 лет и попали в 1% наиболее цитируемых для своей предметной области и типа документа) и пропустили их через программу VOSviewer, позволяющую визуализировать библиометрические данные в том числе по соупотреблению в публикациях ключевых слов. Получилась вот такая картинка, разбившаяся на 6 достаточно отчётливых кластеров.

Но нам интересна не тематическая группировка ключевых слов, а тенденции в исследованиях, поэтому эти же ключевые слова и взаимосвязи между ними лучше отобразить в VOSviewer вот таким образом, в зависимости от среднего года, к которому относятся те или иные высокоцитируемые публикации.

И вот какие из самых "недавних" ключевых слов там можно увидеть:

1. Связка слов вокруг термина Aggegation Operator, используемого в нечёткой логике, среди которых наиболее интересное - Multi-Criteria Decision Making. Если совсем просто, то это - раздел математических методов исследования операций, который изучает принятие решений, но не просто на основе большого количества критериев (как можно было бы догадаться из названия), а критериев, противоречащих друг другу. Простейший пример - формирование портфеля ценных бумаг, где управляющего портфелем всегда интересуют бумаги с максимальной доходностью, но с минимальным риском. Проблема тут - в том, что у инструментов с высокой доходностью и риски тоже высокие. Похожие решения, которые нам приходится принимать в повседневной жизни (например, о покупке телефона или выбора места для отпуска), как правило, принимаются нами не на основе математического расчёта каждого из этих параметров, а на основе интуиции, которая часто нас подводит. Исследования же мультикритериального принятия решений в ИИ помогают математически просчитать случаи, в которых биологический мозг уже неспособен принять оптимальное решение.

Динамика публикационной активности в мире по теме "multi-criteria decision making" - все публикации

Динамика публикационной активности в мире по теме "multi-criteria decision making" - только высокоцитируемые публикации

Обратите внимание, что если всплеск публикационной активности по MCDM в целом достаточно яркий, хотя и близок к линейному, то у высокоцитируемых публикаций всплеск ещё более выдающийся - то есть, недавние исследования по мультикритериальному принятию решений внезапно начали очень активно цитироваться: причём, в работах не только в по искусственному интеллекту.

С одной прорывной областью разобрались. Что дальше?

2. Даже далёкий от темы ИИ человек наверняка слышал о таком термине как глубокое машинное обучение, поэтому обратите внимание на близко связанный с ним термин под названием "свёрточные нейронные сети" (convolutional neural networks). Это тип нейронных сетей, которые предназначены для распознавания образов. Интересно другое - количество патентов на изобретения, связанные со свёрточными нейронными сетями, как мы часто наблюдаем в инновационном процессе, тоже начало расти через год-два после начала взрывного роста активности публикационной - и в прошлом году вышло вперёд (по секрету скажу, что их количество за неполный 2019 год уже перевалило за полный 2018й: но пока только для патентов). Это очень важная связь между наукой и инновациями, для лишнего подтверждения которой мы сейчас собираем примеры из совершенно разных предметных областей: если вы видите всплеск научных исследований по какой-то потенциально коммерциализируемой тематике, через год-два ждите всплеска и патентной активности по ней же.

Сравнение динамики публикационной и патентной активности по теме свёрточных нейронных сетей

3. Теория Демпстера-Шафера. Это - математическая теория, необходимая для вычисления вероятности события, но не простого, вроде подбрасывания монетки, а сложного, вроде победы в спортивном состязании. Исход итогового события зависит от исходов промежуточных событий, каждое из которых имеет свою, отличную от 50%, вероятность. Исследования теории Демпстера-Шафера в искусственном интеллекте и позволяют с более высокой точностью предсказывать исход таких событий. Интересно, что эту связку терминов мы нашли при анализе высокоцитируемых публикаций не за 10 лет, а за последние 3 года.

В подтверждение "прорывного" характера этой темы - динамика публикационной активности по теме "теория Демпстера-Шафера" в Web of Science Core Collection: тоже ничего сверхинтересного, если смотреть на общее количество исследований, но почему-то десятки публикаций прошлого года недавно начали очень активно цитироваться.

Динамика публикационной активности по теме теории Демпстера-Шафера: все публикации, содержащие термин "dempster-shafer theory“, "belief function", "uncertainty measure“, "power aggregation operator“ или "dependence assessment" в журналах, относящихся к предметной области “Computer Science, Artificial Intelligence”, в Web of Science Core Collection

Динамика публикационной активности по теме теории Демпстера-Шафера: только высокоцитируемые публикации, содержащие термин "dempster-shafer theory“, "belief function", "uncertainty measure“, "power aggregation operator“ или "dependence assessment" в журналах, относящихся к предметной области “Computer Science, Artificial Intelligence”

Теперь давайте посмотрим, что видно у нас в стране. Россия с 9139 публикациями по искусственному интеллекту занимает пока 24е место в мире.

Ведущие 25 стран мира по публикационной активности по теме исскусственного интеллекта, и их количество публикаций по этой теме за всю историю.

При этом, топ-10 российских организаций по количеству проведённых исследований выглядит так.

Ведущие российские организации по публикационной активности в области искусственного интеллекта

А вот как цитируются их работы.

Цитируемость их публикаций, нормазизованная по предметной области (область - одна и та же, этим пунктом можно принебречь), году и типу документа

Среднемировой уровень, напомню - единица. Среднероссийский уровень - 0,56.

Нормализованная средняя цитируемость российских и иностранных публикаций в области искусственного интеллекта

Цитируют нас хуже ожидаемого уровня по той же причине, что и в большинстве остальных наук: в области искусственного интеллекта мы также предпочитаем публиковаться в низкоимпактовых журналах.

Процент публикаций по искусственному интеллекту в журналах того или иного квартиля по импакт-фактору

Здесь важно оговориться, что основная масса исследований по ИИ всё же придаётся огласке не в научных журналах, а на конференциях (73% в мире и 63% - когда там присутствует российская аффилиация). Но распределение журналов по квартилям, характерное для всего остального постсоветского пространства, говорит об общей практике публикационной активности, направленной пока, увы, не на максимизацию огласки результатов исследований.

По этой же причине высокоцитируемых публикаций по ИИ с российской аффилиацией всего 4. Вот они и вот их авторы с российской аффилиацией.

Наконец, вот так выглядит топ авторов из России по индексу Хирша их публикаций по искусственному интеллекту (редкий случай, когда индекс Хирша целесообразно использовать, но в таблице я вам всё равно его значение не покажу)

Friday 10 August 2018

Профили организаций в Web of Science Core Collection. Отчитываемся.

Я всерьёз думал о том, что у меня будет возможность отчитаться перед вами о ходе работы по созанию профилей ещё год назад, но именно на прошлое лето и осень и пришёлся пик работы по их выверке, и теперь, когда летом появилось чуть-чуть свободного времени, будет странно не сказать, что в итоге получилось.

Получилось примерно 600 профилей, из которых более 300 - это академические институты, 200 с чем-то - университеты, плюс ряд специализированных научных организаций и корпораций. В сумме все эти организации ответственны примерно за 85% публикаций России в Web of Science Core Collection.

Довольны ли мы ходом работы по созданию профилей? Однозначно, да. Собираемся ли мы останавливаться? Определённо, нет, ведь общее количество научных организаций в России больше на порядок, и я грубо оцениваю количество в принципе профилируемых организаций в 2000 (помимо исследовательских институтов и университетов это коммерческие организации, музеи, библиотеки, даже общеобразовательные школы, у которых есть в Web of Science Core Collection хотя бы одна публикация). Две тысячи - против шестисот, которые есть сейчас. Поэтому мы будем и дальше выверять новые профили и при необходимости корректировать существующие.

Я хочу сказать спасибо всем представителям научных организаций, которые терпеливо разбирались с нашими инструкциями по созданию профилей, провели свою (зачастую - не побоюсь этого слова, титаническую) работу по выгрузке тысяч публикаций и ручной чистке списков из вариантов написаний адресов, а затем ждали, пока профиль будет создан. Просто для примера: по состоянию на лето 2017 года были отдельные организации - в частности, в в Сибирском отделении РАН, - с более чем пятью сотнями вариантов написания названия, которые самостоятельно собрали их и прислали нам.

Отдельное спасибо за выдержку - тем, чьи профили заработали как надо не сразу и кто сохранял хладнокровие при их последующем редактировании. Таких случаев было немного, но они были, и я догадываюсь, чего стоит сохранять присутствие духа и продолжать вежливую переписку в такой ситуации.

Благодаря этой совместной работе, теперь можно довольно легко ответить, какие научные организации, например, активнее всего занимаются исследованиями в области искусственного интеллекта в России:

В InCites же списком из 200 крупнейших российских университетов или 300 крупнейших исследовательских институтов, который сам по себе уже представляет отдельный рейтинг научных организаций по практически любому библиометрическому показателю, уже мало кого удивишь. Напоминаю, все картинки тут увеличиваются при нажатии.

16 крупнейших российских университетов по показателю публикационной активности в Web of Science Core Collection за 2008-2017 гг

Разумеется, использовать такой рейтинг надо аккуратно и помнить о различиях в практике публикационной активности и цитируемости в разных областях знания.

За состоянием профиля надо будет периодически следить - без этого, увы, никак. Даже если ваша организация прописала в трудовом договоре с научным сотрудником, что публикации отныне могут выходить вот с таким и только таким названием института/университета, всё равно есть возможность того, что в журнале будет допущена опечатка - или что на этапе индексации материалов она возникнет у нас, что, признаться, тоже иногда может происходить. И, если вдруг Вы найдёте единичные случаи непривязанных или ошибочно привязанных к профилю публикаций - поправить ситуацию можно будет довольно просто. Вот, например, публикация Финансового Университета, которая не привязана к профилю (сейчас для Финансового Университета у нас создано 29 различных правил привязки адресов, но кокретно такой вариант не учтён):

Справа внизу, как видите, есть эта самая надпись "suggest a correction" (в русскязычном варианте интерфейса она будет выглядеть как "предложите поправку". Нажимаем на неё:

Далее, в открывшейся форме обратной связи заполняем все поля, отмеченные звёздочкой, вроде вашего имени, адреса электронной почты и т.д., в поле "Type of Change" выбираем "Organization-Enhanced".

Есть ещё маленькая формальность - система попросит вас сообщить название журнала, конференци или книги, в которой находится "проблемная" публикация. Скопируйте туда название из записи о публикации. В принципе, даже если вы нечаянно скопируете туда заголовок самой публикации - ничего страшного не произойдёт.

Теперь, собственно, суть нашего запроса: "Please add the name variant <сюда копируем строчку с непривязанным адресом> to the organization profile of <название вашего профиля в Web of Science Core Collection>" и жмём кнопку "submit". Всё, запрос ушёл в службу поддержки и в течение ближайшей пары недель публикация будет привязана к профилю.

Если же вдруг (что маловероятно, но на всякий случай) различия между профилем и реальным положением вещей будут значительными, и отправлять более десятка таких запросов вам будет неудобно - можно написать об этом мне, и мы вместе определим, как его скорректировать.

Что делать тем, у кого профиля пока нет? Тут у нас тоже есть хорошие новости. Раньше надо было смотреть вот это десятиминутное видео, выгружать данные из Web of Science, затем самостоятельно делать список вариантов написания названия. Теперь мы можем существенно упростить задачу. Если ваша организация хочет себе профиль в Web of Science Core Collection, просто напишите мне об этом на pavel.kasyanov@clarivate.com - и сообщите заодно название вашей организации. Теперь мы можем позволить себе на своей стороне провести поиск по вашему названию, выгрузить список вариантов их написания и прислать вам его на согласование. Если с ним всё в порядке - мы в течение месяца-двух сделаем вам профиль.

Финальная просьба. Если вдруг в прошлом году вы подавали заявку на создание профиля, но профиля по-прежнему нет (или он есть, но по каким-то причинам он не соответствует тому, что вы ожидали получить) - отпишитесь, пожалуйста, в комментариях. Особенно если вас не устроило качество нашей работы с вами или вы - один из двух людей, поствивших дизлайк нашей видеоинструкции по сборке профиля. Это - как раз один из тех случаев, когда нас можно и нужно ругать.

Monday 19 February 2018

Высокоцитируемые российские учёные, или Высшая лига отечественной науки

Большое спасибо всем, кто пришёл на нашу церемонию награждения Russian Citation Awards в прошлый четверг - это определённо была лучшая церемония награждения из тех четырёх, что мы уже проводили. Я заготовил шутку, что, если убрать меня с групповой фотографии, то средний IQ присутствующих на ней будет зашкаливать, но фотограф - человек очень проницательный, и поэтому сразу оставил меня за кадром.

Но церемония награждения - это лишь часть большой работы по составлению списка высокоцитируемых российских учёных, о котором сейчас пойдёт речь. Этот список мы теперь будем ежегодно обновлять и использовать его в качестве основного источника номинаций Russian Citation Awards.

Как мы составляем этот список?

Попыток составления списков и рейтингов ведущих учёных в мире или в отдельной стране предпринимается сотни, если не тысячи, и каждый из методов, от экспертной оценки до чистого библиометрического анализа, хорош по-своему. Нашей задачей было подобрать достаточно простую и прозрачную методологию, которая бы не требовала специальных навыков, чтобы интерпретировать и обсуждать её результаты, и при этом оставляла простор для дискуссии: кто из российских учёных сможет претендовать на Нобелевскую премию или медаль Филдса? Кто из них обладает наибольшим потенциалом? Какие научные коллективы в России – лучшие? За почти десятилетнюю историю нашего присутствия в России мы пытались объединить более чем пятидесятилетний опыт Института Научной Информации с нашим собственным знанием российской науки, авторов и авторских коллективов, и наконец готовы представить основанную на подсчёте высокоцитируемых публикаций методику, используя которую, можем с уверенностью говорить: эти авторы – лучшие в своих предметных областях.

За основу для составления этого списка мы взяли нашу глобальную методологию определения высокоцитируемых авторов, благодаря которой каждый год мы составляем список Highly Cited Researchers, и его можно считать международной лигой наиболее успешных и влиятельных учёных. Автор считается принадлежащим к той или иной стране не на основании гражданства, а на основании тех организационных аффилиаций, которые он или она указывает в своих публикациях. К сожалению, авторов с российскими аффилиациями в нашем глобальном списке единицы, хотя в нём присутствуют и учёные с русскими фамилиями, но не аффилированные с российскими исследовательскими организациями.

Для составления нашего списка мы в ноябре 2017 года взяли все высокоцитируемые публикации из базы данных Web of Science Core Collection, в которых указана хотя бы одна российская аффилиация - таких оказалось более 1600. Затем мы разбили этот массив на предметные области нашего рубрикатора Essential Science Indicators и определили список лидеров в каждой из предметных категорий. Единственным существенным отличием в адаптации нашей глобальной методологии является исключение из анализа всех работ с количеством соавторов более тридцати. В глобальной методологии крупные коллаборации исключаются из анализа только в области физики, мы же приняли решение исключить все работы за авторством более тридцати человек вне зависимости от предметной области. Подчеркнём, что мы ни в коем случае не хотим сказать, что эти работы не заслуживают внимания или не являются важными результатами научных исследований. Но, поскольку библиометрические методы не позволяют оценить вклад каждого из авторов в процесс проведения исследования за исключением случаев, когда количество соавторов в публикации всё же небольшое, было бы некорректно указывать в одном списке участников крупных коллабораций вместе с остальными.

Методика подсчёта количества высокоцитируемых публикаций привлекательна ещё и тем, что позволяет выделять лучших авторов за последние 10 лет. Это обеспечивает, с одной стороны, формирование списка лучших авторов на основании их действительно актуальных и выдающихся достижений, а, с другой стороны, даёт нашему списку необходимый динамизм для того, чтобы каждый год в нём могли появляться новые имена. Это особенно интересно ввиду наметившегося в России роста количества высокоцитируемых публикаций. Напомним, для определения предыдущего списка - 2016 года - высокоцитируемых российских публикаций в Web of Science Core Collection было немногим более 1400, в то время как на момент выгрузки данных для настоящего отчёта их было уже более 1600.

Динамика количества высокоцитируемых публикаций России. Источник: Clarivate Analytics InCites

С итоговым списком вы можете ознакомиться ниже. Число в скобках рядом с именем автора – количество его или её высокоцитируемых публикаций с российской аффилиацией в Web of Science Core Collection на 15е декабря 2017 года. Если числа два, то второе – общее количество высокоцитируемых документов этого автора (не только с российскими аффилиациями).

Сельскохозяйственные науки

Евгения Валерьевна Благодатская (6),

Яков Викторович Кузяков (2/16)

Из шести высокоцитируемых документов с российской аффилиацией, опубликованных Евгенией Валерьевной, пять относятся к предметной области «Agricultural Sciences» согласно нашему классификатору Essential Science Indicators, и ещё один – к предметной области «Environment/Ecology». Более детальный классификатор Web of Science, который допускает отнесение источников к двум и более предметным областям, точнее отражает суть научных работ Евгении Валерьевны: в основном, они относятся к области почвоведения. И действительно: Евгения Валерьевна специализируется на микробиологии почв и микробных процессах в них. Основная рабочая аффилиация Евгении Валерьевны – отдел почвоведения умеренных экосистем Гёттингенского университета имени Георга-Августа, и в высшую лигу российской науки она попала из-за указания во всех своих работах в качестве второй аффилиации Института физико-химических и биологических проблем почвоведения РАН в подмосковном Пущино. Евгения Валерьевна получила статус высокоцитируемого российского учёного ещё в 2016м году.

Яков Викторович Кузяков является руководителем этого же отдела почвоведения умеренных экосистем Гёттингенского университета, и в Web of Science Core Collection по состоянию на начало 2018 года индексируется 16 его высокоцитируемых публикаций, из которых всего в двух (обе написаны в соавторстве с Евгенией Благодатской) указана аффилиация Казанского Федерального Университета, что даёт Якову Викторовичу одновременно и международный статус Highly Cited Researcher, и обеспечивает ему место в нашем "российском" списке.

Биология

Владимир Николаевич Уверский (13/18)

С внушительным отрывом в области биологии лидирует Владимир Николаевич Уверский, автор восемнадцати высокоцитируемых работ в Web of Science Core Collection, из которых 17 опубликованы с российской аффилиацией Института Биологического Приборостроения РАН, что также находится в подмосковном Пущино. Основная аффилиация Владимира Николаевича, при этом – Университет Южной Флориды. Ключевая тема его исследований – неупорядоченные или несворачивающиеся белки, их свойства и влияние на возникновение тех или иных заболеваний у человека: от болезни Альцгеймера до рака.

Сулейман Ифхан-оглы Аллахвердиев (14)

С точки зрения предметных классификаторов Web of Science, Сулейман Ифхан-оглы Аллахвердиев – самый «мультидисциплинарный» из российских биологов. Семь из его четырнадцати высокоцитируемых публикаций относятся к области ботаники, ещё четыре – к инженерным наукам, две - к биологии и одна – к химии. Эти важнейшие для современной науки работы посвящены исследованиям биохимии водорослей как источника биотоплива, а также вопросам фотозащитных механизмов и флюоресценции организмов. Доктор Аллахвердиев заведует Лабораторией управляемого фотобиосинтеза Института физиологии растений РАН в Москве и был удостоен награды Russian Citation Awards в 2016м году.

Константин Викторович Северинов (6/7)

Профессор Ратгерского Университета Константин Викторович Северинов также не теряет связей с Россией, и на шести из его семи высокоцитируемых работ также указаны аффилиации либо Института Молекулярной Генетики, либо Института Биологии Гена РАН, в которых Константин Викторович заведует лабораториями, либо же Сколковского Института Науки и Технологий, где он тоже имеет звание и должность профессора. Все шесть рассмотренных нами высокоцитируемых публикаций Константина Викторовича посвящены теме CRISPR – одному из самых горячих направлений последних лет в молекулярной биологии и генетике, сегодня находящему применение и в других предметных областях.

Алексей Александрович Гуревич (4)

Научный сотрудник Центра алгоритмической биотехнологии Санкт-Петербургского Государственного Университета Алексей Гуревич является автором четырёх высокоцитируемых публикаций, относящихся, если быть точнее, к направлению биоинформатики и посвящённых секвенированию и сборке геномов. Эти работы, оказывающие сегодня, как видно, огромное влияние на ход исследований в области биоинформатики во всём мире, также важны для исследования микробиома человека и разработки новых антибиотиков.

Клиническая медицина

Притом что около четверти всех научных публикаций мира сейчас выходят именно в области клинической медицины, что делает её наиболее распространённой и актуальной предметной областью мировой науки в начале XXI века, в России это направление занимает по популярности лишь третье место, заметно отставая по количеству опубликованных российских исследований по физике и химии в Web of Science Core Collection. Важно также подчеркнуть, что несколько сотен публикаций российских авторов по клинической медицине за последние 10 лет были опубликованы в составе крупных коллабораций по онкологии (например, Атлас ракового генома), сердечно-сосудистым заболеваниям (исследование HOPE-3) и многим другим и, поскольку количество соавторов по этим исследованиям заметно превышало 30, мы, как уже упоминалось выше, приняли решение исключить такие работы из анализа, после чего из всех авторов мы отобрали четверых, опубликовавших наибольшее количество высокоцитируемых документов.

Владимир Фёдорович Семиглазов (10/13)

Онколог Владимир Фёдорович Семиглазов заведует научным отделом опухолей репродуктивной системы и отделением опухолей молочной железы Центра онкологии им. Петрова. Слово «breast cancer» встречается в заголовке каждой из десяти его высокоцитируемых работ (а если снять условное ограничение в 30 соавторов на документ – то тринадцати), которые в сумме были процитированы более четырёх с половиной тысяч раз. Владимир Фёдорович был награждён нами как высокоцитируемый российский автор в 2016м году.

Всеволод Борисович Матвеев (9)

Всеволод Борисович - член-корреспондент РАН, заведующий отделением онкоурологии Центра онкологии им. Блохина. При его участии опубликовано 9 высокоцитируемых публикаций в журналах, входящих в нашу базу данных Web of Science Core Collection, посвящённых диагностике и лечению рака предстательной железы.

Вера Горбунова (9)

Вера Горбунова – профессор биологии в университете Рочестера в Нью-Йорке. Её лаборатория исследует механизмы долголетия и устойчивости к раку. Объект её исследования – это животные, такие как голый землекоп или гренландский кит, которые в природе живут долго и не подвержены заболеваниям. Цель её работы – найти молекулярные механизмы долголетия этих животных и затем использовать эти механизмы для улучшения здоровья и продления жизни человека. Вера является соавтором девяти высокоцитируемых публикаций (двенадцати, если снять упомянутое выше ограничение), где в качестве российской аффилиации, в основном, указан Центр онкологии им. Блохина. Вера также была награждена нами как высокоцитируемый российский автор в 2016м году.

Сергей Владимирович Орлов (8)

Всего на одну высокоцитируемую работу меньше опубликовал онколог и торакальный хирург Сергей Владимирович Орлов из Первого Санкт-Петербургского государственного медицинского университета имени академика Павлова. Сергей Владимирович занимается лечением рака легких и разработкой индивидуальных методов лечения в торакальной онкологии.

Технические науки

Михаил Александрович Шеремет (10)

Со значительным отрывом от ближайших преследователей в этой предметной области лидирует профессор кафедры теоретической механики Томского Государственного Университета, а также профессор кафедры атомных и тепловых электростанций Энергетического института Томского Политехнического Университета Михаил Александрович Шеремет. Михаил Александрович является автором десяти высокоцитируемых публикаций в Web of Science Core Collection, посвящённых турбулентному теплопереносу, численным методам механики жидкости и газа, а также математическому моделированию теплового излучения.

Науки о земле

Владимир Владимирович Середин (5)

Лидером по количеству высокоцитируемых российских работ по наукам о земле стал Владимир Владимирович Середин. Уже отправив в Институт геологии рудных месторождений, петрографии, минералогии и геохимии Российской академии наук поздравления и приглашение на нашу церемонию награждения Russian Citation Awards, мы с огромным сожалением узнали о том, что 27го января 2014 года Владимир Владимирович ушёл из жизни в возрасте 63х лет. Мы выражаем наши глубочайшие соболезнования родным и коллегам Владимира Владимировича Середина и надеемся внести свой скромный вклад в популяризацию его работы и достижений. 5 высокоцитируемых работ г-на Середина в Web of Science Core Collection захватывают лишь последние 10 лет его научной деятельности и не отражают полностью весь его вклад в мировую науку. При непосредственном участии Владимира Середина были описаны важнейшие месторождения редкоземельных элементов в Приморье и Китае, предложены альтернативные, более экологичные способы их добычи, а также открыт нетрадиционный тип залегания минералов, поставивший под вопрос представления минералогов о процессах их формирования.

Ольга Николаевна Соломина (4/6)

При участии директора Института Географии РАН Ольги Николаевны Соломиной было опубликовано на одну высокоцитируемую работу больше, но, поскольку две из них были написаны в крупных коллаборациях, итоговая цифра несколько пострадала, но её более чем достаточно для того, чтобы присутствовать в настоящем списке. Работы Ольги Николаевны посвящены колебаниям горных ледников и климата в голоцене, созданию реконструкций климата высокого разрешения, а также проблемам дендрохронологического датирования морен, вулканических извержений, катастрофических процессов в горах и археологических находок. Интересный факт: в составе Межправительственной группы экспертов по изменению климата Ольга Николаевна в 2007 году была награждена Нобелевской Премией Мира.

Математика

Николай Владимирович Кузнецов (10)

Геннадий Алексеевич Леонов (9)

С заметным отрывом от ближайших преследователей в списке наиболее цитируемых математиков России идут заместитель заведующего кафедрой прикладной кибернетики математико-механического факультета Санкт-Петербургского Государственного Университета Николай Кузнецов и декан того же факультета Геннадий Алексеевич Леонов, которые были награждены нами как высокоцитируемые российские учёные в 2016м году.

Материаловедение

Руслан Зуфарович Валиев (5)

Директор Института физики перспективных материалов и заведующий кафедрой нанотехнологий Уфимского Государственного Авиационно-Технического Университета, а также руководитель Лаборатории механики перспективных массивных наноматериалов для инновационных инженерных приложений Санкт-Петербургского Государственного Университета Руслан Зуфарович Валиев – пионер целого направления в материаловедении, связанного с разработкой объемных наноструктурных материалов. Работы Руслана Зуфаровича посвящены исследованиям по наноструктурированию металлов и сплавов с использованием интенсивных пластических деформаций, т.е. больших деформаций в условиях высоких приложенных давлений.

Физика

Сергей Владимирович Морозов (17)

Из всех российских учёных Сергей Владимирович – пожалуй, самый частый гость нашего всемирного списка Highly Cited Researchers и остаётся им даже после того, как «нобелевская» статья 2004 года о графене, в которой его фамилия идёт сразу же за фамилиями Гейма и Новосёлова, выпала из десятилетнего периода, используемого для подсчёта и анализа высокоцитируемых публикаций. Сергей Владимирович руководит лабораторией "Физика полупроводниковых наноструктур" Института проблем технологии микроэлектроники и особочистых материалов Российской академии наук в Черноголовке, а также лабораторией Функциональных низкоразмерных структур в НИТУ МИСиС.

Артём Ромаевич Оганов (10/12)

Работа профессора Сколковского Института Науки и Технологий Артёма Оганова находится на стыке физики, химии и материаловедения. Артём Ромаевич занимается исследованиями по созданию методов компьютерного дизайна новых материалов и предсказания кристаллических структур. Артём Оганов был награждён нами как высокоцитируемый российский учёный в 2016м году.

Сергей Дмитриевич Одинцов (6/10)

Как и Владимир Николаевич Уверский в области биологии, Сергей Дмитриевич Одинцов регулярно входит в наш глобальный список Highly Cited Researchers в области физики. Сергей Дмитриевич проводит исследования в области теоретической физики и космологии и занимается разработкой теории, которая объяснила бы историю нашей вселенной. Его основная аффилиация также иностранная – это Каталонский Институт Перспективных Исследований, а в списке высокоцитируемых российских авторов он попадает из-за аффилированности с Томским Государственным Педагогическим Университетом, указание на которую присутствует в шести его высокоцитируемых публикациях из десяти в Web of Science Core Collection.

Юрий Семёнович Кившарь (6/26)

26 высокоцитируемых работ профессора Австралийского национального университета Юрия Семёновича Кившаря – цифра более чем внушительная, и благодаря ей он также присутствует в нашем глобальном списке Highly Cited Researchers. Шесть из этих публикаций написаны в аффилиации с Университетом ИТМО в Санкт-Петербурге, где Юрий Семёнович является соруководителем Центра нанофотоники и метаматериалов, чего вполне достаточно для того, чтобы присутствовать и в настоящем списке.

Науки о космосе

Дмитрий Игоревич Макаров (3)

Игорь Дмитриевич Караченцев (2)

Игорь Дмитриевич и Дмитрий Игоревич являются соответственно главным научным сотрудником и заведующим лабораторией внегалактической астрофизики и космологии Специальной Астрономической Обсерватории РАН в Карачаево-Черкесии. Результаты их совместной работы над каталогами данных внегалактических расстояний представляют собой важнейшие для современной науки данные о распределении вещества в близкой Вселенной, а разработанные ими алгоритмы и методы для исследования галактик и их систем используются астрономами по всему миру.

Заключение

Пока список высокоцитируемых российских учёных небольшой - в нём всего 22 фамилии, и из них в наш глобальный список входят вообще единицы - но, уверен, с годами он будет расти. Мы ещё раз выражаем нашу искреннюю признательность всем перечисленным авторам за их многолетний труд, равно как и всем тем, кто поддерживал их в процессе создания этого важнейшего для современной науки знания. В рамках нашей инициативы мы хотели выделить наиболее влиятельных российских учёных и немного поведать вам о том, чем они занимаются. Надеемся, что кому-то этот список послужит вдохновением, кому-то ориентиром, а самим высокоцируемым авторам поможет ещё успешнее реализовывать свой потенциал.

Если у вас есть вопросы по методологии составления списка или его результатам - пишите свои вопросы в комментариях, а в индивидуальном порядке вопросы мне можно задать по электронной почте, её адрес указан вверху страницы.

Friday 28 July 2017

Российские публикации в наиболее престижных журналах Web of Science Core Collection

Отвлёчёмся на денёк от профилей научных организаций, тем более что в InCites вышла новая и очень интересная функция, которая сильно поможет нам в оценке российской, да и вообще всей постсоветской науки.

Вот уже месяц как у нас есть возможность смотреть, в журналах какого квартиля по импакт-фактору (и насколько активно) публикуются те или иные авторы, организации и страны. Пока такой функции не было, всё это вручную высчитывал для вас Иван Стерлигов из Высшей Школы Экономики, теперь же этот процесс занимает не сутки и не часы, а минуты.

Динамика публикационной активности России и некоторых других стран в Web of Science Core Collection, за исключением Emerging Sources Citation Index

Напомню: у России уже пятый год очень заметно растёт публикационная активность в ведущих мировых научных журналах, заветный показатель в 2,44% из президентского указа либо уже достигнут, либо вот-вот будет, смотря насколько внимательно вы вчитываетесь в текст самого указа, но проблема того, что нас мало цитируют, остаётся.

И все эти пять лет мы говорим: это происходит оттого, что наши учёные публикуются в хороших (прошедших самую жёсткую процедуру отбора журналов в мире), но низкоимпактовых журналах. Низкоимпактовых, то есть, низкоцитируемых - в первую очередь журналы эти слабо цитируются из-за того, что читательские аудитории у них небольшие. И теперь мы можем не только в несколько кликов посмотреть, насколько много или мало мы публикуемся в журналах определённого уровня, но и выявить чемпионов в России по росту количества публикаций в наиболее престижных изданиях.

Вот, например, разбивка по квартилям журналов всё тех же стран-соседей России по рейтингам публикационной активности за 2007-2016 годы. В кружке над гистограммой мы добавили показатель нормализованной средней цитируемости публикаций каждой из этих стран за этот же период.

Соотношение публикаций в журналах разных квартилей за 2007-2016 гг. и нормализованная средняя цитируемость этих публикаций у некоторых стран

Как видно, Россия в этом ряду - наиболее активно публикующаяся страна в журналах четвёртого квартиля не только по относительным, но и по абсолютным показателям, а между соотношением количества публикаций в высоко- и низкоимпактовых изданиях и итоговой цитируемостью этих публикаций есть очень хорошая корреляция.

Тем не менее, положительная динамика есть - мы начинаем всё активнее публиковаться в ведущих журналах. Посмотрите, количество российских публикаций в журналах первого, второго и третьего квартилей за последние 10 лет почти удвоилось.

Динамика публикационной активности России в разбивке по квартилям журналов

Тем не менее, растёт и количество публикаций в источниках, не имеющих импакт-фактора: это материалы конференций, книги, журналы гуманитарного профиля (для них, как многие из вас знают, мы импакт-фактора не рассчитываем, поскольку законы наукометрии в гуманитарных областях работают гораздо хуже) и журналы Emerging Sources Citation Index. Хорошо это или плохо - сказать сложно: доклады на топовых мировых конференциях - конечно, хорошо, чрезмерная публикационная активность в журналах Emerging Sources Citation Index при возможности отправить эту же рукопись в журнал с импакт-фактором - не очень.

Так кто же в России активнее всего публикует работы в ведущих даже по меркам Web of Science журналах? Говорить об этом можно долго - теперь мы можем изучить:

кто прекрасно понимал, где надо публиковаться, и безо всяких мер по поддержке публикационной активности, а кто начал наиболее успешно применять это знание за последние годы;
кто публикуется в наиболее престижных журналах потому что участвует в крупных международных коллаборациях, а кто предпочитает пробиваться в эти журналы своим умом и талантом (о том, как в InCites исключить из анализа коллаборации с количеством соавторов больше определённого значения, мы рассказывали здесь);
кто больше всего прибавил в плане относительных показателей (% documents in Q1/Q2), а кто - в абсолютных (Documents in Q1/Q2) и т.д.

- и я призываю тех, у кого есть доступ к InCites (а сейчас это уже десятки научных организаций в России), самостоятельно воспользоваться новой функцией в отчётах по организациям и по людям, я же расскажу только о наиболее значимых, на мой взгляд, тенденциях.

Как сравнить списки организаций по связанным с квартилями показателям в InCites. Изображение кликабельно, как и все остальные.

Наблюдение первое, самое важное: Курчатовский Институт, ФИАН и Объединённый Институт Ядерных Исследований (организации, наиболее активно участвующие в крупнейших международных коллаборациях) остаются в топе по этому показателю даже если задать максимальное пороговое значение для количества авторов, равное единице. То есть, в ведущие журналы мира они умеют попадать и безо всяких Atlas или CMS collaborations:

Процент работ ведущих российских научных организаций, написанных без каких-либо соавторов, в журналах первого квартиля по импакт фактору

Наблюдение второе: лидеры роста публикационной активности в наиболее престижных журналах мира - это пять университетов проекта 5-100. Какие - смотрите ниже:

Органзации-лидеры роста публикационной активности в журналах первого квартиля по импакт-фактору. Количество соавторов для каждого документа ограничено 100, чтобы исключить влияние проектов Большого Адронного Коллайдера и подобных им.

В заключение - ещё три важных оговорки.

Первая. Использовать импакт-фактор сам по себе как показатель оценки - плохая идея. Он является лишь показателем качества журнала, но не самого результата научного исследования. Так, более трети документов, опубликованных в Nature с 1980 года, до сих пор не были процитированы ни разу, а огромное количество работ, за которые их авторы были удостоены Нобелевских премий, были опубликованы в журналах второго и третьего квартиля. Про Нобелевские работы в журналах четвёртого квартиля - не смотрел, врать не буду. Тем не менее, как дополнение к существующим показателям публикационной активности и цитируемости, использование импакт-фактора, как мы только что видели, очень оправдано. Тем более оно оправдано для стимулирования публикационной активности там, где с цитируемостью публикаций дела обстоят пока не очень хорошо.

Вторая. Не так важно численное значение импакт-фактора, как то место, которое журнал по этому показателю занимает в своей предметной области. Квартили в этом смысле - очень хорошая и наглядная разбивка.

И третья. Совсем зацикливаться на журналах первого и второго квартилей тоже не стоит. В зависимости от той предметной области, которой вы занимаетесь, в зависимости от вашего стажа в научных исследованиях вашим потолком на сегодняшний день вполне может быть журнал третьего, четвёртого квартиля - или даже журнал из Russian Science Citation Index. Просто помните об огласке, придаваемой результатам ваших научных исследований: чем авторитетнее журнал, чем у него шире читательская аудитория - тем лучше.