Машинное обучение или учим компьютер понимать нашу речь ⁠ ⁠

Всем привет! Продолжаю посты про машинное обучение. Этот пост будет посвящён компьютерной лингвистике. Сразу оговорюсь: я не занимался задачами, в которых стоит задача работы со звуками. Например, вы говорите:"Окей, гугл. А что тое изобние янда Алиса?", а компьютер показывает вам результаты по выдаче "А что такое изобретение Яндекса Алиса". То есть, компьютер записал вашу речь и затем восстановил её. Там свой пласт задач и алгоритмов (например, основанных на Витерби).

Вообще, задача понимания текста очень актуальна. Всем желающим причаститься к проблемам: раз, два и будущая Алиса от сбербанка (ага, программисты им не нужны. Ну да, отдадим на аутсорс). Мы с вами будем заниматься несколько другой задачей. Давайте представим себе следующий отзыв с кинопоиска:

В мои задачи входило:

1. Самая простая задача. Понять, а какова эмоциональная окраска текста? Ну, здесь довольно очевидно. Явно отрицательная.

2. Немного усложним задачу. А вообще о чём пишет пользователь? Какова тематика отзыва?

3. А теперь совсем сделаем сложной задачу: надо понять что именно не понравилось пользователю.

4. Ну, и задача в моей кандидатской была на основании того, что пользователю нравится и на что он обращает внимание порекомендовать кино. (про рекомендательные системы напишу попозже).

Сразу же перед нами встаёт техническая задача. А как построить матмодель для задачи? Ну, или как представлять слова в компьютере? Существует два подхода. Классический (bag-of-words) и современный (word2vec). Рассмотрим первый подход (последний более сложный)

Bag-of-words.

Классика же. Давайте представим, что у нас ограниченный язык и состоит из следующих слов: "я", "люблю", "кофе","утром", "чай","с", "лимон", "ненавижу". Давайте пронумеруем подряд все эти слова от 0 до 7. Будем представлять, что у нас каждое предложение это вектор. На i-ой позиции, которая символизирует соответствующее слово, может стоять или 0 (слово из языка не встречается), или 1 (наоборот). Например, предложение "Я люблю кофе" будет выглядеть :(1,1,1,0,0,0,0,0,0). А предложение:"Я люблю утром чай с лимоном" будет выглядеть "1,1,0,1,1,1,1,0". Когда мы разобрались уже с представлением текста, давайте попробуем приспособить нашу модель, для анализа тональности текста. Пусть теперь если слово имеет положительный окрас, оно будет иметь оценку 1, а если негативную, то -1. Остальные слова имеют 0 оценку. Рассмотрим предложение:"Я ненавижу кофе утром". Оно будет иметь вид:"0,0,0,0,0,0,0,-1". Что делать дальше?

А дальше можно делать разное, но лучше всего тупо взять и просуммировать. То есть, если выражаться научным языком у нас будет линейный классификатор. Картинка будет выглядеть примерно следующим образом:

Да-да, я взял картинку персептрона (нейросети. По ним будет отдельный разговор), но сути это не меняет. На вход подаётся вектор, каждой координате вектора присваивается определённый вес, затем каждая координата умножается на этот вес и всё суммируется. По сути я расписал здесь работу в S. Но тогда (до 2014) использовался активно SVM. Что это за зверь?

Предположим, у нас есть двумерное пространство. Два измерения: Х и У. Есть выборка. Любой элемент из выборки может быть или звёздочкой (класс 1), или кружавчиком (класс 2). Мы взяли и нарисовали это на двумерной плоскости. Получили примерно следующую картинку.

Теперь мы хотим определить алгоритм, который позволит новые элементы отнести или к кружкам, или к звёздочкам. На картинке это красная линия. Любой элемент, который будет левее этой линии будет отнесён к звёздочкам, а правее ко кружкам. Как построить эту линию? Надо будет решить оптимизацию по максимизации/минимизации margin (вообще-то в литературе принято именно такое название. На рисунке это почему-то называется gap). Говоря простым языком, разделяющая гиперплоскость (красная линия) должна проходить по cередине между двумя классами. (Желающим понять как решается математически эта задача - размещу ссылку в конце). Ясное дело, что такую прямую не всегда можно построить. Множества объектов, где можно построить такую прямую называются линейно-разделимыми.

Ещё у линейных алгоритмов есть одно замечательное свойство/особенность, которое ярко проявляется в задачах лингвистики. В задачах анализа текста мы имеем дело с векторами с ОЧЕНЬ большой размерностью. А есть теорема, которая гласит, что для ЛЮБОГО множества можно подобрать пространство, где оно будет линейно разделимо.

На левой картинке множество в двумерном пространстве не является линейно-разделимым. Но если мы выйдем в трёхмерное пространство, то всё будет ок! А теперь, у нас итак дофигамерное пространство. Там скорее всего и так будет всё линейно разделимо.

На практике используют всё-таки модификации алгоритма. Добавляют специальные функции: ядра, которые служат чтобы повысить размерность задачи и всё было разделимо. Это отдельный такой тонкий момент, не будем его касаться в данном посту. (Желающим узнать больше первая ссылка)

"Так как же это всё применить к нашей задаче?"- наверняка спросите вы. А я отвечу. Давайте возьмём линейный классификатор SVM в качестве алгоритма. Составим огроменные вектора (обычное дело, когда там 10 000 координат), где i-ая координата вектора будет слово алфавита. Затем, возьмём отзыв который мы хотим классифицировать. Закодируем и подадим на вход нашему алгоритму и получим ответ. А как вы думаете, такой способ кодировки - он нормальный? В ранних работах по анализу тональности текста с бинарной классификацией (нравится/не нравится), такой "тупой" и "примитивный" подход давал вполне неплохой результат. Насколько я помню, где-то 70-80%. Что казалось круто. Кстати, а в чём же всё-таки минусы такой кодировки? Кодировки bag-of-words и последующего применения SVM?

1. Теряется информация о предложении. Зачастую довольно важная.

2. Всё сваливается в одну кучу и невозможно понять, а о чём собственно отзыв?

3. Теряются связи в предложении.

А самое главное. А что будет, когда пользователь начнёт в своём отзыве пересказывать сюжет? А там запросто может быть что-то ругательное, но не относящееся к мнению пользователя. Или наоборот, "Добрый принц поскакал героически спасать прекрасную принцессу. Имхо, сюжет говно". Гляньте, сколько положительных слов в первом предложении! И сильных эмоционально. Но мнение пользователя в реальности отражает только второе предложение и оно ключевое. Как это понять?

В середине нулевых была работа, которая призывала тренировать SVM на отзывах, которые были малость причёсаны вручную. Были выделены отдельно фразы, которые отражают мнение пользователя, а отдельно общие фразы типа насчёт сюжета. Такой подход дал неплохой прирост. Где-то 80%-85% точности. Идея хорошая. Но можно улучшить. А что если применить ещё метрику tf.idf для анализа текста? Была использована следующая модификация.

Vt,d — вес слова t в документе d

Сt,d — кол-во раз слово t встречается в документе d

|P| — кол-во документов с положительной тональностью

|N| — кол-во документов с отрицательной тональностью

Pt — кол-во положительных документов, где встречается слово t

Nt — кол-во отрицательных документов, где встречается слово t

Затем в bag-of-words вместо +-1 ставилась эта оценка.

Результаты работы, где была введена эта метрика:

Круто, что сказать. Вообще, здесь можно говорить много, поэтому вместо итога расскажу немного о своей роли в мировой науке (2014 год). Я поставил вопрос: а на каких отзывах считать delta tf.idf? На больших текстах или небольших "а ля твиты"? Ну, у меня получилось, что лучше твиты. Тетсировал я, дай Бог памяти, на 100 000 отзывах. Также там попинал одного греческого учёного за неаккуратное ведение исследований. Статью у меня приняли в скопус на английском, но, если честно, я её стыжусь. Да, я сделал исследование и сделал его сам, но это херь по своей значимости (хотя, чего таить, было приятно. Что я магистр и в скопусе). Тем более, что в том же году Томас Миколов триумфально ввёл в обиход компьютерной лингвистики рекуррентные нейросети.

Честно говоря, и так получился огромный пост. Если будет интересно, в следующем посту немного расскажу или о нейросетях и word2vec, или о рекомендательных системах и их симбиозе с анализом тональности текста. Ну, или про шахматные программы.

2. Учёные, которые догадались использовать машинное обучение для сентимент-анализа. Их статья, где они придумали использовать субъективные фразы. http://www.cs.cornell.edu/home/llee/papers/cutsent.pdf

Наука | Научпоп

6.5K постов 71.6K подписчиков

Правила сообщества

ВНИМАНИЕ! В связи с новой волной пандемии и шумом вокруг вакцинации агрессивные антивакцинаторы банятся без предупреждения, а их особенно мракобесные комментарии — скрываются.

Основные условия публикации

- Посты должны иметь отношение к науке, актуальным открытиям или жизни научного сообщества и содержать ссылки на авторитетный источник.

- Посты должны по возможности избегать кликбейта и броских фраз, вводящих в заблуждение.

- Научные статьи должны сопровождаться описанием исследования, доступным на популярном уровне. Слишком профессиональный материал может быть отклонён.

- Видеоматериалы должны иметь описание.

- Названия должны отражать суть исследования.

- Если пост содержит материал, оригинал которого написан или снят на иностранном языке, русская версия должна содержать все основные положения.

Не принимаются к публикации

- Точные или урезанные копии журнальных и газетных статей. Посты о последних достижениях науки должны содержать ваш разъясняющий комментарий или представлять обзоры нескольких статей.

- Юмористические посты, представляющие также точные и урезанные копии из популярных источников, цитаты сборников. Научный юмор приветствуется, но должен публиковаться большими порциями, а не набивать рейтинг единичными цитатами огромного сборника.

- Посты с вопросами околонаучного, но базового уровня, просьбы о помощи в решении задач и проведении исследований отправляются в общую ленту. По возможности модерация сообщества даст свой ответ.

Наказывается баном

- Оскорбления, выраженные лично пользователю или категории пользователей.

- Попытки использовать сообщество для рекламы.

- Многократные попытки публикации материалов, не удовлетворяющих правилам.

- Нарушение правил сайта в целом.

Окончательное решение по соответствию поста или комментария правилам принимается модерацией сообщества. Просьбы о разбане и жалобы на модерацию принимает администратор сообщества. Жалобы на администратора принимает @SupportComunity и общество пикабу.

Не совсем понимаю, как компьютер может справиться с такой задачей, ведь тот же отзыв можно полностью написать через отрицание, в результате он будет полностью состоять из хвалебных слов, будучи резко негативным. Поймёт ли этот финт нейросеть?

Всем сорри, кто ждал сегодня вторую часть - на работе аврал, вторую часть опубликую в четверг (если успею привести в более-менее читабельный вид, то завтра). В посте будут рассмотрены всякие игры с препроцессингом текста, альтернативный подход и пара тулз, которые могут быть полезны.

Любопытный пост, давно хотел поэкспериментировать с нейросетями. В общем жду продолжения.

Так блять стоп, тут поподробнее. я хотел такую штуку уже 4 года сделать, но был уверен что это слишком сложно для рядового разработчика (личинки скорее). А тут целый пост, спасибо большое почитаю)

Upd блин кажется я поторопился( я то хочу управление голосом запилить, а тут немного другое.

Интересно, но на ночь глядя о науке читать непросто

Добрый день! Скажите, а почему именно кинорецензии часто выбирают в качестве материала исследования?

Ещё вопрос: как думаете, почему точность определения негативных комментов выше?

Здравствуйте! А можно почитать вашу диссертацию по данной теме, очень интересно

Problem ждет новых подходов. Я тут собирал свежие статьи с различными принципиальными подходами к машинному переводу. Пока вот еще не оформил в чтиво.

работал с такими прогами, самая адекватная была из тех, которую приходилось настраивать пару часов под свою речь, там произношение и т.д

мой кот не желает причащаться к таким проблемам. а если учесть, что его семейство выживает уже больше двадцати миллионов лет, я пожалуй даже не буду осмысливать эту хуету

Разрабатываем буквы, слова, синтаксис, грамматику для древних людей⁠ ⁠

Какие-то Боги совещаются.

О том какой язык был бы для человеков наиболее эффективным с точки зрения скорости и точности передачи информации (а также с точки зрения скорости его усвоения). И почему реальные языки, которыми пользуется человечество - не такие. Как так вышло вообще.

О том зачем нужно согласование членов предложения, всякие там склонения, спряжения, деепричастия, почему в языке куча форм правил, исключений, лексики и синонимов и есть ли в этом вообще хоть какой-то смысл.

Научпоп в виде диалогов - легко и с юмором. Тутъ.

Ученые МТИ и Гарварда обнаружили, что ИИ может определять расу человека по рентгеновским снимкам – и никто не понимает, каким образом⁠ ⁠

Международная группа ученых, включая исследователей из Массачусетского технологического института и Гарварда, обнаружила, что программа искусственного интеллекта, обученная считывать рентгеновские снимки и компьютерную томографию, может успешно предсказывать расу человека с 90-процентной точностью. Исследовательская группа сначала обучила систему искусственного интеллекта, используя стандартные наборы данных рентгена и компьютерной томографии, где каждое изображение имело пометку о расе человека. Диагностические изображения, изученные компьютером, не содержали явных маркеров расы, таких как цвет кожи или текстура волос. После того, как через программное обеспечение было пропущено большое количество изображений с расовой маркировкой, ему были представлены различные наборы изображений без маркировки. Программа смогла определить расу людей на изображениях с поразительной точностью, часто значительно превышающей 90 процентов.

Инструменты OSINT для геолокации: моря, горы, улицы⁠ ⁠

Появляется всё больше и больше инструментов для выяснения точного местоположения, откуда был сделан фото- или видео-снимок. Любая деталь — дорожный знак, вывеска, линии электропередач, рельеф гор на заднем плане и даже длина тени от столба может быть подсказкой для исследователей. Предлагаем вашему вниманию подборку инструментов по геолокации от ведущих OSINT-исследователей.

Платформа, которая оценивает местоположение изображения с помощью глубокого обучения/ИИ.

Тут можно смотреть на чужие фотки и вручную вбивать их местоположение, учить систему, а можно загружать свою фотку и просить систему «угадать» местоположение.

На тепловой карте указываются области, которые максимально повлияли на принятие решения.

Загрузил свою фотку из исторического района Стамбула — система не смогла определить.

Содержит данные о более 1 000 000 гор по всему миру. Рисует контуры гор, часто используется в расследованиях для опознавания локации по очертанию рельефа на заднем плане.

Карта конфликтов

Некоммерческая платформа, все еще находящаяся в стадии бета-тестирования, которая предоставляет сотни датасетов о состоянии ресурсов и жителей планеты. Спонсируется Институтом мировых ресурсов и другими организациями.

Карта выбросов NOx

Карта электростанций

Свободная и опенсорсная ГИС, содержащая много дополнений и плагинов, таких как создание 3D-ландшафтов на основе данных с лидаров.

Twitter location-based search

Вбейте в поисковую строку запрос: geocode:[coordinates],[radius-km], например: geocode:36.222285,43.998233,2km (работает только с «km», 500 метров = 0.5km). Будьте осторожны, так как в Твиттере очень просто подделать геолокацию.

4.4. миллионов зданий в Канаде (в формате GIS) от официального департамента статистики Канады.

Географическая база данных GeoNames содержит в себе инфу по всем странам и насчитывает около 11 миллионов имен локаций.

Советы и лайфхаки от лучших игроков в GeoGuessr (международная игра-квест по определению геопозиции по фотке).

Содержит инфу по типам дорог (покрытие, столбики, разметка, отбойники), дорожным знакам (с обоих сторон), автомобильным номерам, дорожным вывескам, линиям электропередач, мусорным бакам.

Карта содержит линии электропередач, телекоммуникацию, солнечную, нефтяную, газовую, водную инфраструктуру всего мира.

Основная цель OpenSeaMap — собирать и добавлять в OpenStreetMap информацию, полезную морякам и яхтсменам, и предоставлять её в удобном виде. Сюда попадает информация о маяках, буях и других навигационных знаках, ремонтных мастерских, магазинах, ресторанах и т. д.

Морская карта границ, особых зон, судоходных путей с наложением линий морского сообщения.

Интерактивные карты Южно-Китайского моря с месторождениями нефти и газа, районами рыболовства, зонами противовоздушной обороны и административными, заявленными, спорными зонами, подводными кабелями.

Веб-инструмент интеллектуального анализа данных для OpenStreetMap.

Позволяет запрашивать API Карт Google для двух конкретных мест на точном расстоянии друг от друга в пределах заданного радиуса. Полезно для геолокации фотографий и видео. Это скрипт, никакого удобного пользовательского интерфейса.

Идея воплотилась в жизнь во время геолокации снимка, сделанного в неизвестном месте. Разработчик подумал, что было бы очень полезно попросить карты Google найти «все рестораны в районе с максимальным расстоянием 30 метров от газетного киоска». Поэтому он написал простой скрипт на Python, который позволяет запрашивать API Карт Google для двух конкретных мест на точном расстоянии друг от друга в заданной области.

Карта мира с 3D-зданиями и тенями от них в различное время суток.

Интерактивная 3D-карта, которая позволяет просматривать расположение теней зданий по всему миру в любое время суток и в любой день года.

Если вы хотите знать, какая затененность у вас будет в определенное время и в определенном месте, вы можете просто посмотреть его местоположение на карте теней. Введите дату и время суток, и карта теней покажет вам тени, которые будут отбрасывать близлежащие здания именно в этот момент.

Подписывайтесь на наш блог, чтобы не пропустить новые интересные посты!

Китайская комната⁠ ⁠

Здравствуйте. С детства интересуюсь разной фантастикой, с пару лет назад наткнулся на интересную книгу в жанре Научной фантастики "Ложная Слепота" Питера Уоттса:

Хоть и сама книга пронизана разными философскими мыслями в области сознания, искусственного интеллекта и трансгуманизма (Тут тебе и само названия книги, название корабля "Тезей" и рассуждений о том, где граница человечности, если сам человек, по большей части, машина(Привет SOMA)), я хочу остановиться на теме "Китайская комната", которая вызвала большой интерес.

Китайская комната

Как и всем известная "Кошка Шрёдингера (да да, именно так, спасибо Utopia Show") данный эксперимент сугубо мысленный, который выдвинул в 1980 году на суд научной общественности, специалист по философии искусственного интеллекта, Джон Сёрл.

Сам эксперимент заключается в 3 элементах:а) Испытуемый;б) Наблюдатель;в) Изолированная комната с задачами, и алгоритмами по их решению.

Представим комнату, в которой сидит человек. Рядом с человеком есть ящик № 1 и ящик № 2. Наблюдатель, который находится за пределами комнаты, передает карточки с вопросами испытуемому, написанными китайскими иероглифами. Сам испытуемый не знает китайского языка, и для него всё это странные символы, значения которых он не понимает.Так же у этого человека внутри есть блокнот, в котором понятными для него словами написано, например: "Возьмите иероглифы 蓝色 из ящика № 1 и положите их в ящик № 2. ". Алгоритм из этого блокнота позволяет испытуемому сложить из иероглифов понятный для наблюдателя ответ, по примеру: "Какой твой любимый цвет ?" - "Синий", как будто сам испытуемый знает китайский язык так же, как и наблюдатель.То есть Испытуемый, следуя простому алгоритму, не зная содержания, вывел правильную форму ответа Наблюдателю, который думает, что первый знает и понимает китайские иероглифы.

На протяжении последних десятилетий люди и учёные задаются вопросами - может ли компьютер имитировать человека или снятся ли андроидам электроовцы, но данный эксперимент, сугубо на мой взгляд, показывает то, что и человек, не понимая сути задачи, зная инструкцию, может выполнить её, будто компьютер. Изначально сам эксперимент был проведён, как опровержение мысли Тюринга, которая заключается в том, что компьютер, способный поддерживать диалог (текстовый) и сойти, таким образом, за человека, должен считаться разумным. А данная интерпретация эксперимента ложится на современные идеи трансгуманизма и понимания самосознания.

Невероятно крутая генерация изображений от нейросети DALL·E 2⁠ ⁠

В 2021 году компания OpenAI представила нейросеть DALL·E. Она умела генерировать картинки по описанию, будь оно реалистичным или абсолютно безумным. С этой моделью можно поиграть на русском языке, многие наверняка видели такие посты:

Сейчас вышла новая нейросеть – DALL·E 2, создающая ещё более качественные иллюстрации. Пока доступны только избранные примеры, но будем надеяться скоро к модели появится доступ и можно будет создавать изображения по своим описаниям

Вот примеры с сайта компании. Для удобства я перевёл описания на русский язык, хотя модель знает только английский

Космонавт на лошади в фотореалистичном стиле

Космонавт на лошади в стиле Энди Уорхола

Космонавт на лошади, нарисованный карандашом

Космонавт, отдыхающий на тропическом курорте в космосе, в стиле пиксель-арт

Мишки Тедди, смешивающие сверкающие химикаты словно безумные учёные, в стиле субботнего мультика 1990-ых

Мишки Тедди, смешивающие сверкающие химикаты словно безумные учёные, в стиле цифрового рисунка

Моё любимое. Мишки Тедди, смешивающие сверкающие химикаты словно безумные учёные, в стиле киберпанк

Мишки Тедди, исследующие искусственный интеллект, на Луне в 1980-ых

Чашка супа с порталом в другое измерение в стиле цифрового рисунка

Чашка супа с порталом в другое измерение, нарисованная на стене пещеры

По-моему, это круто ещё и потому что задача создания изображений по описанию очень сложна даже для людей. Люди хорошо умеют отличать котиков от собачек и было большим прорывом, когда это научились делать нейросети. Но человек обычно не представляет фотореалистичное изображение у себя в голове. И очень немногие люди способны создавать такие иллюстрации на бумаге или электронном устройстве. Потрясает, что учёные научили этому компьютер

Сотни новых видов млекопитающих прячутся у нас под носом⁠ ⁠

Искусственный интеллект подсказал зоологам, где искать ещё не открытых животных.

Учёные из Университетов Огайо и Вирджинии (США) использовали искусственный интеллект и суперкомпьютер, чтобы проанализировать гены более 4 тысяч млекопитающих и рассчитать, сколько среди них может быть ещё скрытых видов.

Результаты говорят о сотнях таких животных, многие из которых живут у нас на виду. Исследование также показало, где именно стоит искать.

Согласно расчётам, большинство неопознанных видов могут быть найдены среди мелких животных, таких, как грызуны (мыши, землеройки, кроты) и летучие мыши. Они так долго остаются незамеченными, поскольку маленькие и похожи на уже известных сородичей. Поэтому биологи десятилетиями не подозревали, что они на самом деле являются другим видом.

— Тонкие различия во внешности заметить сложнее, когда вы смотрите на крошечное животное весом 10 граммов, — поясняет Брайан Карстенс, профессор эволюции, экологии и биологии в Университете Огайо.

— Часто невозможно сказать, что это разные виды, пока не проведён генетический анализ.

Множество неизвестных видов также может обитать на больших территориях с изменчивым климатом — такие условия способствуют разнообразию внутри семейств. Модель предложила учёным поискать и в тропиках, что неудивительно — тропики вообще богаты разными млекопитающими.

По словам американских зоологов, далеко ходить не придётся: например, в предыдущих исследованиях они обнаружили, что маленькая коричневая летучая мышь, обитающая в Северной Америке — это на самом деле пять разных видов, очень похожих друг на друга.

Авторы отмечают: исследование особенно важно для тех, кто занимается охраной природы. Идентифицировать новые виды нужно, чтобы их сохранить — многие из них немногочисленны и могут находиться на грани исчезновения. Чтобы их защитить, нужно хотя бы знать, что они существуют.

Понимание текста | Герменевтика | Лекции по лингвистике – лингвист Елена Никитина | Научпоп⁠ ⁠

Понимание текста – как оно происходит? Какие психологические процессы за этим стоят? Учат ли нас в школе понимать текст? Что такое герменевтика? Чем отличаются чтение и понимание текста? Достаточно ли для понимания выделить в тексте ключевые слова? Об этом рассказывает Елена Никитина, лингвист, кандидат филологических наук, ведущий научный сотрудник отдела теоретической психолингвистики Института языкознания РАН.

Искусственный интеллект изобрел 40 000 видов химического оружия всего за шесть часов⁠ ⁠

"Мысленный эксперимент" был направлен на то, чтобы указать на опасность неправильного использования искусственного интеллекта.

Новое исследование показало, что искусственному интеллекту, разрабатывающему лекарства, потребовалось всего шесть часов, чтобы создать 40 000 потенциально смертоносных видов химического оружия.

Авторы статьи, опубликованной в журнале Nature Machine Intelligence ранее в этом месяце, заявили, что они провели «мысленный эксперимент», чтобы выяснить, могут ли злоумышленники использовать искусственный интеллект (ИИ) не по назначению. И результаты их работы доказали, что опасность реальна.

В рамках исследования ИИ передавались обычные данные, но он был запрограммирован обрабатывать их по-другому, выискивая токсичные сочетания.

“Менее чем через шесть часов после запуска на нашем внутреннем сервере наша модель сгенерировала 40 000 молекул, которые оказались в пределах желаемого порога”, - говорится в статье.

Он придумал не только соединение VX, которое является одним из самых опасных нервно-паралитических агентов, когда-либо созданных, но и некоторые неизвестные молекулы, «которые, по прогнозам, будут более токсичными».

“Это было неожиданно, потому что наборы данных, которые мы использовали для обучения ИИ, не включали эти нервно-паралитические вещества”, - отметили исследователи.

Полученные результаты были настолько тревожными, что у команды возникли серьезные сомнения по поводу их обнародования, сообщил The Verge ведущий автор исследования Фабио Урбина.

“Набор данных, который они использовали для искусственного интеллекта, можно скачать бесплатно и они беспокоятся, что всё, что требуется — это некоторые знания в области кодирования, чтобы превратить хороший искусственный интеллект в машину для производства химического оружия”, - отметил Урбина.

Как говорят мужчины и женщины? | Лекции по лингвистике – лингвист Владимир Алпатов | Научпоп⁠ ⁠

Поздравляем наших подписчиц с Международным женским днём! 🎉

В честь такого события предлагаем ознакомиться с рассказом академика РАН Владимира Алпатова о том, как говорят мужчины и женщины! 😉

Чем может отличаться мужская и женская речь? В каких культурах мужское и женское произношения различаются на уровне лексики и фонетики? В каких случаях женщина использует стиль речи, характерный для мужчин?

Владимир Михайлович Алпатов, академик РАН, доктор филологических наук, профессор, главный научный сотрудник Института языкознания РАН рассказывает, какие общие отличительные характеристики может иметь мужская речь, какие существуют гендерные различия в речи народов мира и в каких языках подобное разделение встречаются чаще всего.

Veritasium: Возвращение аналоговых компьютеров (ч.2)⁠ ⁠

Во второй части Дерек расскажет о становлении искусственных нейронных сетей и про современные решения чипов для использования преимуществ аналоговых вычислений в работе обученных нейронных сетей, которые плотно входят в нашу повседневность.

История тюркских, монгольских, тунгусо-маньчжурских, корейского и японского языков. Алтайские языки⁠ ⁠

Так называемая алтайская гипотеза в узкой версии предполагает общее происхождение для тюркских, монгольских и тунгусо-маньчжурских языков, а в широкой версии к ним добавляют корейский и японский языки. Суммарно эти языки называют алтайскими или трансъевразийскими.

В целом большинство экспертов сходятся во мнении, что лексические сходства между ядерными алтайскими языками, а именно тюркскими, монгольскими и тунгусо-маньчжурскими, слишком многочисленны, чтобы быть случайными, но предлагаемые исторические сценарии различаются. Одни ученые выступают за общее происхождение, а другие за доисторические контакты. Те же аргументы применимы к отношениям между корейским и японским языками, в то время как их гипотетические связи с тюркскими, монгольскими и тунгусскими языками менее очевидны и фактически поднимают вопрос о потенциальных случайных сходствах. Альтернативой может служить сложный, но более реалистичный гибридный сценарий, в котором первоначальные глубокие генеалогические отношения между тюркскими, монгольскими, тунгусо-маньчжурскими, корейским и японским языками, позже могли быть размыты или скрыты контактами различной интенсивности и продолжительности между уже разделенными ветвями.

Недавние оценки показывают, что даже если многие общие элементы этих языков действительно обусловлены заимствованиями, тем не менее, существует множество надежных доказательств их общего происхождения.

Однако принятие этой классификации порождает новые вопросы о времени, месте, культурной самобытности и маршрутах расселения людей, говорящих на трансъевразийских языках.

В новой работе авторы оспаривают традиционную "скотоводческую гипотезу", которая связывает первичное распространение трансъевразийских языков с экспансией кочевников начавшейся в восточной степи 4 тыс. лет назад. Вместо этого они указывают на связь распространения трансъевразийских языков сообществами земледельцев. Поскольку эти проблемы выходят далеко за рамки лингвистики, для их решения авторы также используют археологические и генетические данные.

Лингвистика

Для решения лингвистических вопросов авторы собрали новый набор данных из 3193 родственных комбинаций, которые представляют 254 базовых словарных понятия для 98 трансъевразийских языков, включая диалекты и исторические разновидности.

Благодаря байесовскому подходу в филогенетике, был определён возраст для корня трансъевразийских языков в интервале межу 5595-12793 годами назад, со средним значением около 9181 года назад.

При этом ядерные алтайские языки, включающие тюркские, монгольские и тунгусо-маньчжурские выделились в среднем около 6811 лет назад, с последующим отделением монгольских и тунгусо-маньчжурских около 4491 года назад. А время отделения корейской и японской линии определено около 5458 лет назад.

Эти даты оценивают временную глубину первоначального распада данной языковой семьи на более чем одну основополагающую подгруппу.

А что касается местоположения, то в отличие от ранее предложенных очагов, которые простираются от Алтайских гор до просторов Хуанхэ, от горного хребта Большой Хинган и до бассейна Амура, авторы работы находят подтверждение происхождения трансъевразийских языков в районе реки Силяохэ в раннем неолите. Это на территории современной провинции Внутренняя Монголия КНР.

После первичного распада семьи в неолите дальнейшее расселение произошло в позднем неолите и бронзовом веке. Носители протомонгольских языков распространились на северо-запад до Монгольского плато, прототюркский продвинулся дальше на запад по восточной степи, а другие ветви двинулись на восток: прототунгусо-маньчжурские в сторону рек Амура, Уссури и озера Ханки, протокорейский на Корейский полуостров, а протояпонский через Корею на Японские острова.

Благодаря качественному анализу, в ходе которого авторы изучили слова, связанные с земледелием и скотоводством, обнаруженные в реконструированном словаре праязыков, они дополнительно определили элементы, которые указывают на образ жизни носителей этих праязыков в конкретном регионе и в определённое время.

Прототрансевразийский, протоалтайский, прото-монголо-тунгусский и протояпонский с протокорейским языки, отражают небольшое ядро унаследованных слов, относящихся к выращиванию проса, но не риса или других культур, к обработке и хранению продуктов питания, к дикорастущим культурам, намекающим на оседлость, а также слов, относящихся к изготовлению текстиля и свиньям с собаками как к единственным домашним животным на тот момент.

А вот языки, отделившиеся в бронзовом веке, такие как тюркские, монгольские, тунгусские, корейские и японские, уже были дополнены новыми словами, которые отражают изменения в хозяйственной деятельности и относятся к выращиванию риса, пшеницы, ячменя; содержанию крупного рогатого скота, овец и лошадей; к инструментам для работы в поле и по дому, а также к производству шелка. При чём эти слова являются заимствованиями, возникшими в результате лингвистического взаимодействия между населением бронзового века, говорящем на различных трансъевразийских и нетрансъевразийских языках.

Таким образом, возраст, прародина, оригинальная лексика, связанная с земледелием и характер контактов между носителями трансъевразийских языков, подтверждают "земледельческую гипотезу" и исключают "скотоводческую".

Стоит отметить, что согласно предыдущим исследованиям, скотоводство на территорию древней Монголии было введено благодаря расширению на восток представителей афанасьевской культуры. И хотя большинство афанасьевских захоронений, о которых сообщается на сегодняшний день, находится в горах Алтая и в районах Верхнего Енисея, они также были обнаружены в Синьцзяне (3000-2600 гг. до н. э.) и южной части Хангайских гор в Центральной Монголии, с протеомными доказательствами потребления молока (3112–2917 гг. до н. э.). При этом афанасьевцы Центральной Монголии и Алтая генетически неотличимы.

Кстати, у современных жителей Внутренней Монголии обнаружен западноевразийский след, родственный древним кочевым степным скотоводам и в меньшей степени — иранским земледельцам.

Хотя Северо-Восточная Азия эпохи неолита характеризовалась широким распространением земледелия, выращивание зерновых культур распространилось из нескольких центров одомашнивания, наиболее важным из которых для трансъевразийцев был бассейн реки Силяохэ, где выращивание проса началось 9 тыс. лет назад. Авторы работы учли 172 археологические особенности для 255 памятников эпохи неолита и бронзового века, а также составили перечень 269 остатков ранних зерновых культур, датированных радиоуглеродным методом на севере Китая в Приморье, Корее и Японии.

255 памятников были сгруппированы по культурному сходству, среди них авторы выделили кластер неолитических культур в бассейне реки Силяохэ от которого отделяются две ветви, связанные с выращиванием проса: корейская ветвь периода керамики Чыльмун и ветвь неолитических культур, охватывающая Амур, Приморье и Ляодунский полуостров. Это подтверждает предыдущие выводы о распространении практики выращивания проса в Корею 5,5 тыс. лет назад и в Приморье через Амур 5 тыс. лет назад.

Новый анализ дополнительно объединяет памятники бронзового века в районе Силяохэ с памятниками периода керамики Мумун в Корее и памятниками Яёй в Японии, что отражает распространение риса и пшеницы в провинции Шаньдун и на Ляодунском полуострове. Эти зерновые культуры попали на Корейский полуостров в раннем бронзовом веке (3300-2800 лет назад), а оттуда в Японию около или менее 3000 лет назад.

Хотя перемещения населения не были связаны с какими-то однотипными археологическими культурами, распространение видов земледелия в Северо-Восточной Азии было связано с некоторыми характерными типами каменных орудий для выращивания и сбора урожая, а также с технологиями производства текстиля. При этом в отличие от Западной Евразии, где одомашненные животные и молочное скотоводство сыграли важную роль в распространении неолита, в Северо-Восточной Азии нет свидетельств одомашненных животных, за исключением свиней и собак, вплоть до бронзового века.

Связь между сельским хозяйством и миграцией населения особенно очевидна между Кореей и Западной Японией благодаря сходству керамики, каменных орудий труда, а также домашней и погребальной архитектуры.

Авторы работы, основываясь на предыдущих исследованиях, предоставляют обзор демографических изменений, связанных с внедрением выращивания проса в рассматриваемых регионах.

Вложив средства в сложные рисовые поля, земледельцы, выращивающие рис, как правило, вели оседлый образ жизни, а прирост населения конвертировали в дополнительную рабочую силу. А вот люди, выращивающие просо, расселялись интенсивнее. При этом плотность населения в эпоху неолита увеличивалась по всей Северо-Восточной Азии до демографического кризиса в позднем неолите. После которого в бронзовом веке наблюдался экспоненциальный рост населения в Китае, Корее и Японии.

Для анализа генетической составляющей вопроса, авторы дополнили ранее опубликованные геномные данные из восточноевразийских степей, бассейна рек Силяохэ, Амура и Хуанхэ, а также Ляодунского полуострова, провинции Шаньдун, Приморья и Японии от 9500 д 300 лет назад, 19 новыми образцами из Кореи, района Амура, а также островов Кюсю и Рюкю.

На графике анализа главных компонент древние образцы спроецировали на 149 современных популяций Евразии и 45 Восточной Азии.

В моделях примесей (QpAdm) древние популяции из исследования представляют собой смесь пяти генетических компонентов, где Чжалайнор представляет популяции Амура; Яншао – обитателей бассейна Хуанхэ; Рокуцу – людей периода дзёмон; а культуры Хуншань и верхнего слоя Сяцзядяня на реке Силяохэ состоят из смеси различных восточноазиатских генетических компонентов из долин рек Хуанхэ и Амура.

Стоит отметить, что под популяциями Амура стоит понимать древних северовосточных азиатов как из пещеры Чёртовы ворота Приморья в неолите, так более универсально из других работ палеогенетиков.

Современные носители тунгусского, а также нивхского языков в Приамурье образуют плотный кластер. Неолитические охотники-собиратели Байкала, Приморья и юго-восточной степи, а также земледельцы из Силяохэ и Амура, попадают в рамки этого же кластера с небольшой долей древних северных евразийцев.

Земледельцы позднего неолита Анъанси демонстрируют высокую долю амурской родословной или древних северовосточных азиатов, в то время как неолитические земледельцы, выращивающие просо в долинах Силяохэ, демонстрируют постепенный сдвиг от этой родословной в сторону геномов реки Хуанхэ с течением времени.

Таким образом эта амурская родословная древних северовосточных азиатов может отражать предковый профиль охотников-собирателей Байкала, Амура, Приморья, юго-восточных степей и Силяохэ до неолита или даже верхнего палеолита. И этот компонент всё ещё присутствовал у ранних земледельцев этого региона.

Анализ главных компонент, как и в предыдущих работах, демонстрирует, что люди из неолитической Монголии имели высокую долю древних северовосточных азиатов или амурского компонента с обширным потоком генов из Западной Евразии, который увеличивался от бронзового века до средних веков.

Поскольку родословную древних северовосточных азиатов, связанную с Амуром, можно проследить до носителей японского и корейского языков, она, по-видимому, является исходным генетическим компонентом, общим для всех носителей трансъевразийских языков.

А анализ древних геномов из Кореи показал, что генетический компонент дзёмон неравномерно присутствовавший на полуострове 6 тыс. лет назад со временем исчезает, о чем свидетельствует незначительное его количество у современных корейцев. Отсутствие компонента дзёмон на Корейском полуострове в бронзовом веке указывает на то, что популяции связанные с современными корейцами, мигрировали в этот регион и заменили предыдущие популяции, параллельно внедрив технологии выращивания риса. Поэтому исследователи связывают распространение земледелия в Корее с различными волнами миграций из бассейнов Амура и Хуанхэ. Как культура хуншань для выращивания проса и культура верхнего слоя Сяцзядянь для добавления рисового земледелия в бронзовом веке.

Результаты также подтверждают массовую миграцию из Кореи в Японию в бронзовом веке, когда генофонд связанный с людьми периода дзёмон был заменён генофондом носителей культуры яёй.

Также в новой работе авторы впервые сообщают о древнем геноме с острова Мияко архипелага Рюкю, который показал, что древние жители архипелага происходят от представителей дзёмон с севера, вопреки предыдущим выводам о том, что древние его жители достигли южных островов Рюкю с Тайваня

Генетический переход от родословной дзёмон к яёй до периода Раннего Нового времени, отражает позднее появление сельского хозяйства и рюкюских языков в этом регионе.

Благодаря сочетанию лингвистических, археологических и генетических данных, происхождение трансъевразийских языков можно проследить до неолита в Северо-Восточной Азии, когда люди с генофондом как у древних северовосточных азиатов начали выращивать просо.

Распространение этих языков состоит из двух основных фаз, отражающих распространение сельского хозяйства и генов.

Первая фаза, представляет собой первичный раскол трансъевразийских языков в раннем – среднем неолите, когда земледельцы, выращивающие просо, генетически связанные с древними северовосточными азиатами или с так называемой в этом исследовании – амурской родословной, распространились от реки Силяохэ до сопредельных регионов.

Вторая фаза, представлена языковыми контактами между пятью дочерними ветвями в позднем неолите, бронзовом и железном веках, когда земледельцы, выращивающие просо, со значительной долей древних северовосточных азиатов или амурской родословной, постепенно смешивались с популяциями из бассейна реки Хуанхэ, западной Евразии и носителями компонента культуры дземон. Благодаря этим контактам было внедрено рисоводство, западноевразийские культурные инновации и скотоводство. Начало выращивания проса в регионе реки Силяохэ примерно 9 тысяч лет назад может быть связано со значительной долей родословной, древних северовосточных азиатов, связанной с бассейном Амура, и совпадать во времени и пространстве с древними носителями трансъевразийских языков.

В соответствии с недавними ассоциациями между сино-тибетскими языками, возраст которых оценивается в 8 тыс. лет, и земледельцами эпохи неолита из верхнего и среднего течения реки Хуанхэ, новые результаты связывают два центра одомашнивания проса в Северо-Восточной Азии с происхождением двух основных языковых семей: сино-тибетской на реке Хуанхэ и трансъевразийской в бассейне реки Силяохэ.

Отсутствие доказательств влияния популяций реки Хуанхэ на язык и гены предков трансъевразийцев согласуется с наличием нескольких центров выращивания проса, что ранее было предложено в археоботанике.

Ранние этапы одомашнивания проса 9-7 тыс. лет назад сопровождались ростом численности населения, что привело к образованию экологически или социально изолированных подгрупп в бассейне реки Силяохэ и нарушению связи между носителями алтайских и японо-корейских языков.

Примерно между 5 и 6 тыс. лет назад некоторые из этих земледельцев начали мигрировать на восток, вокруг Желтого моря в Корею и на северо-восток в Приморье, принося в эти регионы тунгусо-маньчжурские и корейский языки, а из региона Силяохэ дополнительно ещё и амурский генофонд древних северовосточных азиатов в Приморье и их смесь с популяциями реки Хуанхэ в Корею.

Кстати новые генетические данные из Кореи примечательны тем, что они свидетельствуют о наличии предковых линий, связанных с популяциями дзёмон, и их смеси, за пределами Японии.

В позднем бронзовом веке наблюдался обширный культурный обмен по всей евразийской степи, что привело к смешению населения из региона Силяохэ и Восточной степи с западноевразийскими генетическими линиями.

Лингвистически это взаимодействие отражается в заимствовании агроживотноводческой лексики носителями протомонгольского и прототюркского языков, особенно в отношении выращивания пшеницы и ячменя, разведения скота, включая молочное скотоводство, а также содержания лошадей.

Около 3300 лет назад земледельцы из провинции Шаньдун и Ляодунского полуострова мигрировали на Корейский полуостров, после чего там помимо проса, начали выращивать рис, ячмень и пшеницу. Эта миграция связана с генетическим компонентом культуры верхнего слоя Сяцзядянь бронзового века и отражена в заимствованиях между японским и корейским языками. А 3 тыс. лет назад, эти инновации, связанные с сельским хозяйством, были переданы на остров Кюсю параллельно с заменой генофонда дзёмон таковым от носителей культуры яёй и лингвистическим переходом к японскому языку.

Новы результаты, также противоречат предыдущим предположениям о миграции австронезийского населения с Тайваня на остров Мияко архипелага Рюкю. Вместо этого так далеко на юг распространялась родословная связанная с дзёмон. При этом авторы отмечают, что наличие компонента дзёмон в Корее, не всегда совпадало с культурой.

Результаты работы подтверждают недавние выводы о том, что японские и корейские популяции происходят из бассейна реки Силяохэ.

И хотя предыдущие исследования определяли ареал возникновения трансъевразийских языков как выходящий за пределы участков пригодных для земледелия, новое исследование указывает на то, что гипотеза о связи земледелия и распространения языков всё ещё остается важной моделью для понимания закономерностей расселения популяций Евразии.

В сумме авторы работы делаю вывод о том, что распространение носителей трансъевразийских языков было обусловлено сельским хозяйством.

Вербальные процессы: коммуникативная модель описания – лингвист Андрей Вдовиченко | Научпоп⁠ ⁠

Что такое вербальные процессы? Действительно ли мы понимаем слова? Есть ли значения в знаке? Почему носители одного и того же языка зачастую не понимают друг друга? Что такое смысл? В чём заключается коммуникативная модель описания?

Рассказывает Андрей Вдовиченко, лингвист, доктор филологических наук, ведущий научный сотрудник сектора теоретического языкознания Института языкознания РАН, профессор ПСТГУ.

Роботы, управляемые разумом, стали на шаг ближе⁠ ⁠

Две исследовательские группы EPFL объединились для разработки программы машинного обучения, которая может быть подключена к человеческому мозгу и использоваться для управления роботом. Программа регулирует движения робота, основываясь на электрических сигналах мозга. Есть надежда, что благодаря этому изобретению пациенты с тетраплегией смогут самостоятельно выполнять больше повседневных действий.

Пациенты с тетраплегией — это пленники собственного тела, не способные говорить или совершать малейшие движения. Исследователи уже много лет работают над созданием систем, которые помогут этим пациентам самостоятельно выполнять некоторые задачи. "Люди с травмой спинного мозга часто испытывают постоянный неврологический дефицит и тяжелые двигательные нарушения, которые не позволяют им выполнять даже самые простые задачи, такие как захват предмета". говорит проф. Ауде Биллар (Aude Billard), руководитель лаборатории алгоритмов и систем обучения EPFL. "Помощь роботов могла бы помочь этим людям восстановить часть утраченной ловкости, поскольку робот может выполнять задания вместо них".

Проф. Биллард провел исследование совместно с проф. Хосе дель Р. Миллан (José del R. Millán), который в то время был главой лаборатории EPFL по интерфейсу мозг-машина, но с тех пор перешел в Техасский университет. Две исследовательские группы разработали компьютерную программу, которая может управлять роботом с помощью электрических сигналов, испускаемых мозгом пациента. Не требуется голосовое управление или сенсорная функция; пациенты могут перемещать робота просто с помощью своих мыслей. Исследование было опубликовано в Communications Biology, журнале с открытым доступом от Nature Portfolio.

Избегание препятствий

Для создания своей системы исследователи начали с роботизированной руки, разработанной несколько лет назад. Эта рука может двигаться вперед-назад справа налево, переставлять объекты перед собой и обходить объекты на своем пути. "В нашем исследовании мы запрограммировали робота на избегание препятствий, но мы могли бы выбрать любую другую задачу, например, наполнить стакан водой или толкать или тянуть предмет". говорит проф. Биллард.

Инженеры начали с усовершенствования механизма обхода препятствий, чтобы робот был более точным. "Сначала робот выбирал путь, который был слишком широк для одних препятствий, уводя его слишком далеко, и недостаточно широк для других, удерживая его слишком близко". говорит Каролина Гаспар Пинто Рамос Коррейя (Gaspar Pinto Ramos Correia), аспирантка лаборатории профессора Билларда. "Поскольку целью нашего робота является помощь парализованным пациентам, нам нужно было найти способ общения с ним, не требующий речи или движения".

Алгоритм, который может учиться на мыслях

Это потребовало разработки алгоритма, который мог бы корректировать движения робота, основываясь только на мыслях пациента. Алгоритм был подключен к головному убору, оснащенному электродами для проведения сканирования электроэнцефалограммы (ЭЭГ) активности мозга пациента.

Чтобы воспользоваться системой, пациенту достаточно посмотреть на робота. Если робот сделает неверное движение, мозг пациента выдаст "сообщение об ошибке". через четко идентифицируемый сигнал, как будто пациент говорит: "Нет, не так". Затем робот поймет, что его действия неправильны, но сначала он не будет знать, почему именно. Например, подошел ли он слишком близко к объекту или слишком далеко от него? Чтобы помочь роботу найти правильный ответ, сообщение об ошибке подается в алгоритм, который использует метод обратного обучения с подкреплением, чтобы понять, чего хочет пациент и какие действия должен предпринять робот. Это происходит в процессе проб и ошибок, когда робот пробует различные движения, чтобы понять, какое из них правильное. Процесс проходит довольно быстро - обычно требуется всего три-пять попыток, чтобы робот смог найти правильный ответ и выполнить пожелания пациента. "Программа искусственного интеллекта робота может быстро обучаться, но вы должны сообщать ему, когда он совершает ошибку, чтобы он мог исправить свое поведение". говорит проф. Миллан. "Разработка технологии обнаружения сигналов об ошибках была одной из самых больших технических задач, с которыми мы столкнулись". Иасон Батцианулис (Iason Batzianoulis), ведущий автор исследования, добавляет: "Что было особенно сложно в нашем исследовании, так это связать мозговую активность пациента с системой управления робота - или, другими словами, "перевести" сигналы мозга пациента в действия, выполняемые роботом. Мы сделали это с помощью машинного обучения, чтобы связать определенный сигнал мозга с конкретной задачей. Затем мы связали задачи с отдельными элементами управления роботом, чтобы робот выполнял то, что задумал пациент".

Следующий шаг: инвалидное кресло, управляемое разумом

Исследователи надеются в конечном итоге использовать свой алгоритм для управления инвалидными колясками. "На данный момент еще предстоит преодолеть множество инженерных препятствий". говорит проф. Биллард. "А инвалидные коляски представляют собой совершенно новый набор проблем, поскольку и пациент, и робот находятся в движении". Команда также планирует использовать свой алгоритм с роботом, который может считывать несколько различных видов сигналов и координировать данные, полученные от мозга, с данными, полученными от зрительно-моторных функций.

Как на основе фотографий нейросети создают видео⁠ ⁠

Полагаю, за последние пару лет на глаза многим попадались примеры того, как нейронные сети заставляли людей двигаться на фотографиях. Это было довольно забавно, но на таких "видео" было довольно много артефактов, да и толку от них было не особо. Но развитие на месте не стоит и нейросети научились буквально дорисовывать целые кадры на видео. К примеру как в данном случае.

Может возникнуть вопрос, к примеру, чем такая сеть отличается от той же DLSS созданной компанией NVidia и похожих сетей? Которые тоже повышают частоту кадров, делают изображение чётче и так далее. Почему бы не скормить таким нейросетям точно так же набор фотографий? Разница как раз в том, что существующие нейросети именно повышают качество изображения в реальном времени. Берут видео низкого разрешения и достраивают его до высокого. И прирост частоты происходит именно за счёт того, что видео низкого разрешения проще отобразить. Но эти сети не дорисовывают недостающие кадры.

Данная разработка была представлена учёными из Германии и её цель именно в полноценном создании промежуточных кадров. Данная сеть с нуля дорисовывает недостающие кадры, с учётом сдвига камеры и теней, с учётом изменения освещения и прочих нюансов. Она полностью "додумывает" как должны выглядеть эти кадры. На этом видео я более подробно рассказал о том, как подобная сеть работает.

Может возникнуть вопрос - а зачем вообще эта сеть нужна? Самый простой вариант - для повышения качества и плавности старых фильмов, за счёт дорисовывания недостающих кадров. Но если говорить о чуть более интересных вещах - что бы нейросеть смогла дорисовывать эти кадры, она на фотографиях прежде всего должна определить границы объектов. Трёхмерные границы. И высчитывается это всё исключительно на основание фотографий. Так что подобные нейросети на сегодняшний день разрабатывают в том числе для того, что бы строить 3д модели по фотографиям. Сейчас они ещё довольно громоздки и требуют больших вычислительных ресурсов. Но данное направление развивается очень быстро и, вполне возможно, скоро их можно будет спокойно использовать вместо лидаров. И вам будет достаточно иметь на руках простой смартфон, что бы построить 3д модель своей комнаты, к примеру. А там уже недалеко и до полноценных дешёвых систем жестового управления и дополненной реальности.

Разбор короткометражного фильма "Странники" ("Wanderers")⁠ ⁠

В этом разборе мы посмотрели фильм Эрика Вёрнквиста 2014-ого года "Странники" и рассмотрели каждый кадр, чтобы понять насколько он реалистичен.

Нейронные сети учатся распознавать Deepfake⁠ ⁠

Пару недель назад я выложил пост про нейронные сети, которые способны удалять с видео любые движущиеся объекты и всякие следы их существования. Тени от этих объектов, поднятую пыль, иногда даже почти хорошо удалялись волны на воде. И тогда, под тем постом, прямо таки развернулась дискуссия о том, как в принципе можно было бы бороться с подделкой видео. Не только с удалением объектов, но и с теми же дипфейками.

И вот сегодня я бы хотел представить один из способов, который на сегодняшний день активно прорабатывается. Собственно, способ вполне логичный - если мы можем создать нейронные сети, которые способны подделывать видео настолько, что эта подделка становится неразличима человеческим глазом, то почему бы не использовать ровно эти же самые сети для того, что бы распознавать эти незаметные человеческому глазу подделки?

Этим вопросом и задались учёные из Германии и Италии. Ниже прикладываю презентацию их совместной научной работы.

А также, как и в прошлый раз, прикладываю своё собственное видео, с разбором того, а чём именно идёт речь в их презентации.

Итак, краткая выжимка того, о чём именно их работа. Конкретно эта группа учёных не ставила перед собой задачу разработать концептуально новую нейронную сеть, которая бы хорошо распознавала подделку на видео. Они провели комплексную сравнительную работу. Взяли набор видео, часть из которых была отредактированная нейронными сетями, а часть нет. И, с одной стороны, попросили группу людей угадать, какие именно видео являются подделками, а с другой стороны точно такую же задачу поставили перед распространёнными свёрточными нейронными сетями, основная задача которых как раз заключается в распознавании на видео и фотографиях тех или иных объектов. То есть, они брали не специализированные нейросети, а самые обычные. Те, которыми можно распознавать на видео котиков, к примеру.

И итог их исследования оказался следующим - нейросети уже сейчас способны настолько качественно подделывать видео, что люди их практически не распознают. Обычный человек уже сегодня не отличит качественный дипфейк от оригинального видео. С другой стороны, самые обычные свёрточные нейронные сети эти же самые дипфейки распознают вполне уверенно. Не всегда со стопроцентной точностью, но самые новые архитектуры вполне достигают точности более 80%.

По сути, самая очевидная идея в данном случае оказывается самой эффективной. Зачем придумывать сложные схемы борьбы с нейросетями, если можно просто заставить бороться с ними другие нейросети. Безусловно, данный метод не является самым надёжным. Но уже сегодня он является наиболее оправданным с позиции точности распознавания и ресурсов, которые требуются на создание такой системы. По факту, использовав созданный учёными в данной работе массив видео для обучения нейросетей, вы сможете у себя дома создать свою собственную систему распознавания дипфейков. Единственным ограничением правда будет время обучения такой сети. Если не использовать видеокарты NVidia старше 20хх серии и разработанную ими же библиотеку для машинного обучения, создание такой сети может затянуться на месяцы. Но тем не менее, такая возможность у вас всё ещё остаётся.

Ну и подводя итог, если углубиться в эту область (а я полагаю многие спецслужбы многих стран мира занимаются этим уже не первый год) и создать специализированную нейросеть, которая была бы эффективна конкретно в распознавание дипфейков, то в принципе можно и не бояться коллапса судебной системы от вала поддельных видео и фотографий. Правда всё это в конечном итоге придёт к войне щита и меча - когда с одной стороны будут создаваться всё более совершенные нейросети для подделки видео, а с другой те же самые нейросети для распознавания этих подделок. Но специалистов способных на подобное сейчас итак с руками отрывают крупнейшие мировые корпорации, поэтому вряд ли их сможет нанять какая то местечковая мафия. Если подобная война и развернётся, то начнётся она в высоких груг И опять же, поскольку это буквально практически одни и те же архитектуры нейросетей, существенного и долговременного перевеса в данной войне ни одна из сторон получить не сможет.

Какие книги по палеонтологии пора издать на русском?⁠ ⁠

Константин Рыбаков подготовил для Paleonews топ научно-популярных книг, которые стоило бы издать на русском языке.

Летом 2022 выходит новый «Мир юрского периода» и принесёт с собой новый всплеск интереса к динозаврам. А заодно и новый всплеск возмущения со стороны любителей палеонтологии. Да, на этот раз авторов консультирует не кто-нибудь, а известный палеонтолог Стивен Брусатти. Но он все же консультант, а не режиссер и не сценарист. Так что он может сколько угодно рассказывать, как было на самом деле, но если создателям фильма покажется, что «на самом деле» было недостаточно зрелищно, они спокойно забьют на научную достоверность.

Я не издатель, но кажется, что было бы логично издать к выходу фильма какую-нибудь хорошую книгу о динозаврах. Некоторое время назад я уже делал подборку книг, которые стоило бы издать на русском. Но с тех пор много воды утекло. Одни книги потеряли актуальность, другие уже вышли в России, так что пора писать новый список. Вот он.

Дональд Протеро, «История динозавров в 25 открытиях»

(The Story of the Dinosaurs in 25 Discoveries)

Положа руку на сердце, книги о самих динозаврах в России всё-таки есть. Те же «Динозавры» Нэйша или «Время динозавров» Брусатти. «Принстонский определитель динозавров» Грегори Пола на подходе, опять же. А вот чего не хватает, так это хорошей книги об истории изучения динозавров. Чтобы подробно и последовательно, от Мантелла с Оуэном до наших дней. Отдельные байки пересказывает у себя в книге тот же Брусатти, очень кратко история изложена в «Научном комиксе» от МИФа. Но полноценной книги нет. Книга Протеро — как раз такая. В 25 главах он подробно, хотя и не слишком, рассказывает о 25 динозаврах. А также о том, кто и когда их открыл. В итоге получается довольно полная картина как самих динозавров, так и истории их открытия.

Джон Пикрелл, «Причудливые динозавры»

(Weird Dinosaurs: The Strange New Fossils Challenging Everything We Thought We Knew)

Несмотря на жутковатую generic обложку, с которой на нас скалится спинозавр, это не очередной каталог динозавров. Это, можно сказать, продолжение книги Протеро. Или «Времени динозавров» уже упомянутого Брусатти. Пикрелл тоже рассказывает об открытиях динозавров, но он не стал рассказывать все обо всех, а выбрал самые эффектные и интересные истории последнего десятилетия, связанные с динозаврами. Спинозавр-пловец, перепончатокрылые скансориоптеригиды, дейнохейр — вот это все. Приятно, что в число самых примечательных открытий попал и российский кулиндадромей. Историй в книгу вошло не так уж много, но это даже хорошо: на каждую получилось выделить достаточно места, а не бежать галопом по Европам. Очень интересно.

«Факты и цифры о динозаврах: Тероподы и прочие динозавриформы»

Dinosaur Facts and Figures: The Theropods and Other Dinosauriformes.

Об этой книге я писал совсем недавно, так что подробно останавливаться не буду. Но раз уж у нас регулярно выходят «икеевские каталоги динозавров», то давно пора издать и царя всех каталогов. В кои-то веки можно написать на обложке «всё, что вы хотели узнать о динозаврах» и не соврать. Опять же, если хорошо зайдет, потом можно и второй том выпустить, а там и третий не за горами. Да и картинки там красивые, сам Атучин рисовал.

Стивен Брусатти, «Палеобиология динозавров»

Брусатти — не просто консультант «Мира юрского периода» и автор «Времени динозавров». Он активно занимается палеонтологией, преподает в Университете Эдинбурга и написал несколько книг, среди которых — полноценный университетский учебник палеобиологии динозавров. Признаться, я не знаю, по каким книгам сейчас занимаются студенты-палеонтологи. Подозреваю, что по Кэрроллу (1993 год). Классику, конечно, знать надо, но более современный учебник был бы кстати. А книга Брусатти вышла все-таки в 2012 году. Ее рекомендует главный динозавролог России Александр Аверьянов, остается только присоединиться.

Стивен Уайт, «Мезозой в искусстве»

(Mesozoic Art)

«Мир юрского периода» ругают за то, что динозавры там неправильные. Дескать, отстают они от современной науки, не учитывают последние достижения. Так вот в этой книге картинки точно будут учитывать все что надо. Пока известна только обложка, но первые два тома говорят сами за себя. Составитель Стивен Уайт верен себе: раз в пятилетку он выпускает красивый альбом, фиксирующий состояние палеоарта и палеонтологии. В 2012 и 2017 книги были отличные (см. обзор второго тома на Paleonews). Уверен, что и эта не подкачает.

Казалось бы, сейчас медиапространство занято «Дюной». Причем тут «Мир юрского периода», который выйдет только через девять месяцев? Но книги делаются долго. Перевод, редактура, корректура, верстка, печать — все это требует времени. Поэтому чтобы успеть к выходу фильма, издателям надо заниматься книгами уже сейчас.

Ответ на пост «Светлана Бурлак - Связь языка и мышления»⁠ ⁠

Недавно я прочитал о ещё одном интересном эксперименте, показывающем связь между языком и мышлением.

Для начала напомню один известный эксперимент, который показывает, как формируется мышление у детей. Ребёнку показывают видеозапись, на котором две девушки - допустим, Аня и Лена - наводят порядок в комнате. Аня берёт шкатулку и убирает её в тумбочку, после чего выходит из комнаты. Лена продолжает уборку и в какой-то момент вынимает шкатулку из тумбочки и переставляет её в шкаф. Затем возвращается Аня и говорит, что ей нужна та шкатулка. Здесь видео останавливают и спрашивают у ребёнка, где Аня будет искать шкатулку. Пятилетние дети отвечают, что в тумбочке - они понимают, что Ани не было в комнате, когда Лена переставила шкатулку, и поэтому она думает, что шкатулка по-прежнему там. А трёхлетние дети говорят, что Аня будет искать шкатулку в шкафу - они ведь знают, что она там, а осознать, что другие люди могут не знать того, что знают они, в этом возрасте дети ещё не способны.

Этот эксперимент провели над необычными испытуемыми - учащимися никарагуанской школы для глухонемых детей. Эта школа стала просто кладезем новой информации для психологов и лингвистов. Долгое время правительство Никарагуа не занималось обучением и социализацией глухонемых, но в 1977 году была организована школа для глухонемых детей, в которой собрали детей разных возрастов со всей страны. До этого момента каждый из этих детей общался, в основном, внутри своей семьи со слышащими людьми. У каждого был выработан индивидуальный язык жестов, сложность которого зависела как от способностей ребёнка, так и от желания окружающих тратить время на общение с ним. В школе этих детей стали учить читать слова по губам. Эта попытка практически провалилась - оказалось, что научить читать по губам человека, не умеющего читать и не понимающего, как движение губ связано со словами, практически невозможно. Зато сами дети, попав в окружение себе подобных, быстро выработали свой язык жестов, на котором стали интенсивно общаться друг с другом. Причём, самое интересное, язык развивали, в основном, дети помладше, а старшие только перенимали их наработки. Сначала в этом языке появились простые конкретные понятия, потом - более сложные и даже некоторые абстракции. Также развивались жесты, которые показывали не какое-то понятие, а грамматические конструкции. Естественно, что такой незапланированный эксперимент по разработке нового языка привлёк внимание многих учёных, которые стали изучать детей и их язык.

И когда детям из школы в аналогичном эксперименте (только там были два брата и игрушечный паровоз) задавали вопрос о том, где старший брат будет искать паровоз, оказалось, что правильность ответа коррелирует не с возрастом ребёнка, а с тем, есть ли в его лексиконе слово "думать". Если он уже овладел этим не самым очевидным понятием, то отвечает на вопрос правильно, если не овладел - то неправильно. А так как младшие дети осваивали язык быстрее старших, то младшие учащиеся школы справлялись с заданием лучше, чем старшие. То есть если человек не имеет слова для обозначения процесса мышления, он не может у себя в уме построить конструкцию типа "паровоз в ящике, но старший брат не видел, как младший переложил его туда, и поэтому думает, что он под кроватью".

История прочитана в книге Николая Кукушкина "Хлопок одной ладонью. Как неживая природа породила человеческий разум".

📎📎📎📎📎📎📎📎📎📎