16. Музыка

73 мин видео 10 мин чтения MIT

Введение в музыку как объект когнитивной нейронауки

Сегодня мы говорим о музыке. Но сначала позвольте кратко напомнить, что мы делали в прошлый раз. Мы говорили о слухе в целом и о речи в частности. Мы начали с вычислительной теории, размышляя о том, в чём заключается проблема аудиции и что такое звук.

Звук — это волны давления, распространяющиеся по воздуху. Замечательная особенность слуха в том, что мы извлекаем огромное количество информации из этого очень простого сигнала — волн давления, достигающих уха. Мы используем его, чтобы:

распознавать звуки
локализовать звуки
выяснять, из чего сделаны предметы
понимать события вокруг нас

Эти проблемы представляют собой серьёзную вычислительную задачу. В частности, они являются ill-posed. Это означает, что доступная информация не даёт единственного решения, если рассматривать вычислительную проблему узко.

Проблема разделения источников звука

Если у вас есть два источника звука одновременно (например, два говорящих человека или человек, говорящий на фоне сильного шума), это известно как cocktail party problem. Звуки накладываются друг на друга, и нет способа разделить их, не привлекая другую информацию — знания о мире, о природе голосов или о том, кто говорит. Иначе это ill-posed, то есть неразрешимо только на основе базового входного сигнала.

Проблема реверберации

Другой случай ill-posed проблемы в аудиции — это реверберация. Звук, который я издаю, отражается от стен и достигает ваших ушей. Каждый маленький фрагмент звука достигает вас с разной задержкой, проходя разные пути. Если бы мы делали это в соборе, вы бы слышали все эти эхо. Это создаёт ещё одну ill-posed проблему: все эти разные звуки накладываются друг на друга, уменьшаясь в громкости со временем. Вам нужно разложить эту сумму и понять, что это за звук.

Обе проблемы решаются с помощью знаний о реальном мире. В случае реверберации это неявное знание о физике реверберации. Если воспроизвести звуки с неправильной физикой реверберации, вы не сможете справиться с реверберацией. Это говорит о том, что это неявное знание в вашей голове используется, чтобы ограничить ill-posed проблему.

Речь и фонемы

Мы говорили о речи. Phonemes — это звуки, которые различают два разных слова в языке (например, make и bake). Каждый возможный речевой звук не является phoneme во всех языках мира. Языки имеют некоторое подмножество пространства возможных phonemes, которые различают слова в их языке.

Phonemes включают:

гласные — имеют stacked harmonics в спектрограмме
согласные — быстрые переходы в вертикальных полосах спектрограммы, ведущие к harmonic stacks гласных

Проблема talker variability

Данный phoneme или слово звучат очень по-разному и выглядят по-разному на спектрограмме, если их произносят два разных человека. И наоборот, один и тот же человек, произносящий два разных слова, выглядит на спектрограмме очень по-разному. Это означает, что личность говорящего и то, что говорится, перемешаны вместе. Если вы хотите распознать голос независимо от того, что говорится, или распознать слово независимо от того, кто его говорит, перед вами стоит большая вычислительная задача — классическая проблема инвариантности.

Разница между согласными и гласными

На спектрограмме горизонтальные красные полосы — это полосы энергии на разных частотах, которые поддерживаются в течение некоторого промежутка времени. Они типичны для гласных, пения или музыки. Это гармонические звуки, у которых есть pitch. Гласные имеют устойчивые фрагменты.

Вертикальные полосы и переходы в гласные и из них — это согласные. Воздух проходит через них, и вы фильтруете его, располагая голосовой тракт определённым образом. Согласные — это когда вы перекрываете этот воздух или ограничиваете его. Например, в звуках «с» и «ф» вы сильно ограничиваете голосовой тракт, в то время как многие другие согласные вы полностью перекрываете.

Мозговая основа слуха

Нейроанатомия обработки звука, субкортикальная нейроанатомия, гораздо сложнее, чем субкортикальная нейроанатомия зрения. В зрении у вас есть одна остановка в LGN, а затем вы идёте в кору. В слухе у вас есть много остановок между улиткой (где вы улавливаете звуки во внутреннем ухе) и слуховой корой.

Первичная слуховая кора находится на верхней части височных долей, медиально. У неё есть tonotopic свойство — карта частотного пространства с систематическим отображением «высокий-низкий-высокий» частотного пространства.

У животных и в одном недавнем исследовании с помощью MRI свойства реакции первичной слуховой коры хорошо моделируются простыми линейными фильтрами, известными как spectrotemporal receptive fields (STRFs). Это простые акустические свойства данной полосы частот, повышающихся или понижающихся с разной скоростью.

Музыка как уникально человеческая способность

Сегодня мы поговорим о музыке. Это важный момент в курсе, потому что до сих пор мы говорили о функциях, которые в основном являются общими с животными. Речь находится на грани — многие животные очень хорошо воспринимают речь (шиншиллы могут отличать «ба» от «па»), но не используют её так же.

Музыка является уникально человеческой. Большинство вещей, о которых мы будем говорить с этого момента, касаются именно человеческого мозга. Это самые крутые вещи в когнитивной нейронауке человека, потому что они говорят нам о том, кто мы есть как люди. Но они также и самые трудные для изучения, потому что нет животных моделей.

Почему музыка важна?

Музыка одновременно:

уникально человечна — ни одно другое животное не имеет ничего отдалённо похожего на человеческую музыку
универсально человечна — в каждой человеческой культуре, которая была изучена, есть какая-то музыка

Музыка является важной частью того, что значит быть человеком. Она находится в основе человечности.

Пение птиц не считается

Пение птиц не обладает и близко такой гибкостью и изменчивостью. Есть исследование с визуализацией мозга у певчих птиц, которое спрашивает, есть ли у них реакции в областях мозга, связанных с вознаграждением, на музыку. Ответ — да, но только когда значение птичьей песни имеет для них значение (например, потенциальный партнёр). Им не нравится музыка просто за звук. Это сильно отличает их от людей.

Музыка в истории и развитии

Мы занимаемся музыкой очень давно. Археологические записи показывают 40 000-летние костяные флейты, и по структуре флейты видно, что они производят определённые наборы возможных высот звука. Большинство исследователей утверждают, что пение уходит в прошлое гораздо дальше, чем флейты — вам не нужно ничего делать, чтобы петь. Некоторые предполагали, что пение развилось до языка.

Музыка возникает рано в развитии. Очень маленькие младенцы чрезвычайно заинтересованы в музыке. Они чувствительны к beat и melody, независимо от pitch.

Люди тратят много денег на музыку. В прошлом году продажи составили 43 миллиарда долларов.

Зачем мы создаём и любим музыку?

Это загадка, над которой люди думали столетиями, вероятно, тысячелетиями. Это включает всех major thinkers, таких как Дарвин, который сказал: «Поскольку ни наслаждение, ни способность производить музыкальные ноты не являются способностями, имеющими хоть какую-то прямую пользу для человека в его обычных жизненных привычках, они должны быть отнесены к числу самых таинственных, которыми он наделён».

Дарвин неявно предполагает, что музыка — это evolved capacity, сформированная естественным отбором. Это означает, что должна быть какая-то функция, на которую действовал естественный отбор и которая была важна для выживания.

Гипотезы о функции музыки

Половой отбор

Дарвин предполагал, что музыка служит для полового отбора. Он писал: «...прежде чем приобрести способность выражать свою взаимную любовь членораздельным языком». Он выдвинул радикальную идею о том, что музыка появилась до языка.

Управление конфликтом между родителями и потомством

Сэм Майер из Гарварда утверждал, что функция музыки, и в частности пения, имеет эволюционную роль в управлении конфликтом между родителями и потомством. Генетические интересы родителя и потомства в значительной степени пересекаются, но не полностью. Марис предположил, что infant directed song возникла в гонке вооружений между конкурирующими интересами родителя и потомства.

Музыка как «слуховой чизкейк»

Стив Пинкер утверждал, что музыка — это слуховой чизкейк, изысканное кондитерское изделие, созданное, чтобы щекотать чувствительные места наших умственных способностей. Если бы она исчезла из нашего вида, остальная часть нашего образа жизни осталась бы практически неизменной.

Пинкер говорит, что музыка — это не эволюционная адаптация, а альтернативное использование нейронного механизма, который evolved для какой-то другой функции. Самый очевидный вид нейронного механизма, который можно было бы приспособить для этой функции, — это нейронный механизм для речи или языка.

Эмпирический вопрос

Использует ли музыка на самом деле те же механизмы, что и речь или язык? Или нет? Некоторые из этих предположений очень трудно проверить.

Врождённость музыки

Если музыка — это evolved capacity, она должна быть в некотором смысле врождённой, генетически заданной. И она должна присутствовать во всех человеческих обществах.

Специализированный механизм в мозге

Если мы найдём специализированный механизм в мозге взрослых для музыки, докажет ли это врождённость? Нет. Просто потому, что есть специализированный участок мозга, который делает X, не означает, что X является врождённым. Это может быть выучено. Самый яркий пример — visual word form area.

Чувствительность к музыке у новорождённых

Если мы обнаружим чувствительность к музыке каким-то очень специфическим для музыки способом у новорождённых, это будет ближе к доказательству. Но плоды довольно хорошо слышат в утробе. Если мама поёт или в окружающей комнате есть музыка, часть звука проникает в утробу. Это означает, что даже чувствительность к музыке у новорождённого не будет убедительным аргументом, что это не было частично выучено.

Раннее развитие

Психологи развития используют подход: мы не можем точно установить окончательную врождённость, но если вещи присутствуют очень рано и развиваются очень быстро, это говорит о том, что система предназначена для быстрого их усвоения.

Исследования младенцев

Маленькие младенцы очень настроены на музыку. Они чувствительны к pitch и к rhythm.

В одном исследовании взяли двух-трёхдневных спящих младенцев, надели на них EEG электроды и воспроизвели им ритмы. Они хотели проверить beat induction — когда вы слышите ритмичный beat, вы entrained к beat и знаете, когда будет следующий beat. Они воспроизводили ритмы и тестировали реакцию на пропущенный beat. Это ERP ответ, возникающий примерно через 200 миллисекунд после пропущенного, но ожидаемого beat. Это доказательство того, что даже маленькие младенцы имеют некоторое чувство beat.

К пяти-шести месяцам младенцы могут узнавать знакомую melody, даже если она сдвинута по pitch от версии, которую они выучили. Это означает, что они используют относительный pitch, а не абсолютный pitch. Это то, что делают взрослые в музыке. Ни одно животное не может этого сделать.

Пятимесячные младенцы, если воспроизводить им melody в течение одной-двух недель, запоминают её и помнят через восемь месяцев.

Ограничения у новорождённых

Новорождённые не предпочитают consonance dissonance. Они нечувствительны к key. Они обнаруживают изменения времени в ритмах, независимо от того, являются ли эти изменения типичными для того вида музыки, который они слышали, или типичными для более чуждого вида музыки.

Perceptual narrowing

В западной музыке очень распространён isochronous beat — равные временные интервалы. Non-isochronous beat распространён в балканской музыке (например, 822). Шестимесячные младенцы одинаково хорошо воспринимают ритмы, будь то isochronous или non-isochronous. К 12 месяцам они могут только воспринимать и ценить ритмы, знакомые им по их культурному опыту.

Краткого воздействия ранее незнакомого rhythm достаточно, чтобы 12-месячный ребёнок оценил соответствующие различия в этом rhythm, но не для взрослых. Это perceptual narrowing — мы сталкиваемся с этим при распознавании лиц, при восприятии phonemes. Новорождённые младенцы могут различать все phonemes языков мира, а взрослые — нет.

Причина perceptual narrowing в том, что вы хотите иметь инвариантность. Если ваша музыкальная культура говорит вам, что variation не имеет значения, вы отбрасываете это различие и относитесь к ним как к одинаковым.

Музыка во всех человеческих обществах

Музыку notoriously трудно определить. Многие люди указывали на необходимость расширения определения музыки, включая Джона Кейджа, который говорил: «Я могу назвать это музыкой, если захочу».

Несмотря на нигилистический взгляд, что всё может считаться музыкой, есть некоторые вещи, которые мы можем сказать. Можно взять самые канонические формы, где все согласятся, что это музыка, а это нет. Пограничные случаи можно изучить позже.

Социальная природа музыки

Музыка — это не просто набор акустических свойств. На протяжении большей части человеческой эволюции музыка была фундаментально социальным явлением — переживаемая в группах людей как глубоко социальное, коммуникативное, интерактивное предприятие.

Универсалии музыки

В исследовании нескольких лет назад взяли записи музыки со всего мира и спросили, какие свойства присутствуют в большинстве музыкальных произведений. Они обнаружили, что нет ни одного свойства музыки, которое присутствовало бы во всех культурах, но есть много таких, которые присутствуют в большинстве.

Самые распространённые свойства:

Melodies состоят из ограниченного набора дискретных pitches (семь или меньше), расположенных в своего рода scale с неравными интервалами между нотами
В большинстве музыки есть какой-то регулярный пульс — либо isochronous beat, либо non-isochronous с систематическим ритмическим паттерном

Исключение: Примеры музыки из Папуа-Новой Гвинеи содержат комбинации friction blocks, swung slats, ribbon reeds и moaning voices. Они не содержали ни дискретных pitches, ни isochronous beat.

Предыдущая11. Развитие, природа и воспитание II (2018)

Следующая18. Язык I

Оригинальное видео

16. Музыка

MIT

Смотреть на YouTube