?

Log in

entries friends calendar profile Previous Previous
Заметки на полях
Мой адрес -- не дом и не улица...
Я совершенно точно не собираюсь вести журнал. Просто удобно воспользоваться готовым механизмом публикации вместо того, чтобы программировать свой. А хотя бы отрывочных заметок о происходящем с меня просят :)
29 comments or Leave a comment
Продолжаем путешествовать по Португалии. На очереди замечательный город Порту.

Tags:

2 comments or Leave a comment
J. Paulos. Innumeracy: Math Illiteracy and Its Consequences. Holt McDougal, 2001 (первое издание: 1988 г.)

Достаточно знаменитая книга, забавная, но поверхностная. Впрочем, она и не рассчитана на специалистов, поэтому автор обошёлся обсуждением достаточно простых вещей. Для серьёзных читателей есть книги и посерьёзнее :) Кроме того, многие проблемы мне не показались особенно актуальными в мировом масштабе. И ещё в паре глав автор открыто ссылается на книгу Хаффа, которую мы уже обсуждали. Так что темы несколько пересекаются, хотя и не очень сильно. Ещё мне не очень понравился "прыгающий" стиль изложения: членение на главы здесь условно, в действительности книга представляет собой коллекцию случайных мыслей и наблюдений, собранных под одной обложкой. Впрочем, автор об этом прямо упоминает.

Попробуем быстренько пройтись по оглавлению.

1. Примеры и принципы. Здесь нас развлекают простыми примерами того, как мы плохо ощущаем числа. В аквариум какого размера поместится кровь всех жителей планеты? Сколько различных позиций можно "накрутить" на кубике Рубика? Как представить себе миллион, миллиард, триллион? Короче говоря, это похоже на старые книги Перельмана о занимательной математике.

2. Вероятность и совпадения. Насколько удивительны совпадения вроде трёх мальчиков и трёх девочек в семьях по соседству? Какова вероятность выиграть в игровом автомате? Что вообще можно считать удивительным совпадением, а что -- достаточно вероятным событием? Тут обсуждаются известные любопытные факты вроде того, что в группе из 23 человек вероятность совпадения дня рождения у двух или более лиц превышает 50%. Также автор доказывает, что у двух человек из разных концов страны с небольшой, но всё же заметной вероятностью могут оказаться общие знакомые (или хотя бы знакомые знакомых).

Мне понравился пример с девушкой-блондинкой с причёской хвостиком, которая стащила сумочку и скрылась на жёлтой машине с усатым-бородатым негром. Когда парочку поймали, обвинитель пытался доказать, что вероятность схватить не тех очень мала: одновременно должны быть блондинка, жёлтая машина, и негр с усами и бородой. На повторных слушаниях адвокат предоставил свои расчёты, согласно которым эта вероятность существенно выше (мы, как минимум, уже одну такую пару нашли, не так ли?), и подсудимых отпустили.

Интересны наблюдения о "везении/невезении". Предположим, А и Б подбрасывают монетку по очереди. У кого "орёл", тому очко. Через некоторое количество (скажем, 20) подбрасываний, один из игроков, скорее всего, будет лидировать с заметным отрывом, потому что получить совсем красивое распределение 50/50 в такой короткой серии маловероятно. Спрашивается, если лидирует А, велика ли вероятность для Б его догнать? Оказывается, что нет, потому что А и Б по-прежнему равновероятно выбрасывают монету каждой из сторон. Да, соотношение суммарных очков действительно будет стремиться к единице, но кто лидировал, тот, скорее всего, и будет лидировать до конца.

3. Псевдонаука. Достаточно любопытная глава, в которой автор пытается атаковать псевдознания (парапсихологию, астрологию, "вещие сны" и т.п.) именно с точки зрения математики и теории вероятностей. Дескать, вероятность увидеть вещий сон не так уж и мала, а притяжение планет и прочее подобное влияет на ребёнка куда меньше, чем притяжение тел по соседству. Сюда же относится нумерология и прочая ерундистика.
Честно говоря, я даже не знаю, зачем потребовалось так пространно обо всём этом писать. В аннотации нам обещали объяснить, к чему приводит "innumeracy", то есть математическая безграмотность. Но мне кажется, что любители астрологии и прочей хиромантии -- это не математически безграмотные, а просто безграмотные люди. Можно с трудом представлять себе вероятность выиграть в лотерею, но уж какие-то общие соображения о мироустройстве всё-таки иметь.

В этой главе (да, удивительно...) автор приводит два интересных примера из теории вероятности.

Первый -- это игра в красно-чёрные карты. Допустим, в шляпе лежат три карты: красная с двух сторон, чёрная с двух сторон и красно-чёрная. Игрок вытягивает наудачу карту и видит красную сторону. Второй игрок замечает, что эта карта не может быть чёрной с двух сторон. Стало быть, она либо красная с двух сторон, либо красно-чёрная. Далее первому игроку предлагается сделать ставку на вариант "красная-чёрная". Какова вероятность выиграть? Хотя на первый взгляд шансы равны, в действительности шансы первого игрока составляют 1/3 (красно-чёрная карта), а второго -- 2/3 (мы видим либо одну, либо другую сторону красно-красной карты). Это тонкий момент, связанный с пониманием того, какие условия включаются в постановку задачи. В данном случае надо принмать во внимание не только то, что чёрно-чёрная карта исключена из игры, но и то, что мы открыли красную (по крайней мере, с одной стороны) карту.

Второй пример связан с медицинским тестированием. Допустим, у нас имеется тест, который с 98% вероятностью определяет наличие или отсутствие у человека рака. Далее, допустим, что общее количество болеющих раком составляет 0.5% населения. Если у случайного лица взяли тест, и он оказался положительным, какова вероятность наличия рака? Здесь штука в том, что основная масса ложно-положительных тестов приходится на здоровых людей (т.к. общая вероятность болезни невелика). В данном конкретном случае вероятность равна 20%.

4. Истоки проблемы. Похоже, здесь автор не смог отказать себе в удовольствии покритиковать общую ситуацию с математическим образованием :) Дескать, математика не в моде, серьёзные специалисты в школу преподавать не пойдут, серьёзные учёные книг о своей работе для непрофессионалов не пишут и т.д. и т.п. Нам подобные рассуждения хорошо известны, так что не будем на них останавливаться. Мне показалось, что он не чужд романтических представлений о жизни: если бы вот так взять и начать образовывать людей, так сразу ситуация и изменится.

Серьёзная проблема математической безграмотности -- это всякого рода политические последствия, которые не ограничиваются личными глупостями. Например, если объявляют всеобщее тестирование на рак (мы уже обсуждали вопрос ложно-положительных результатов) или войну всяким болезням вроде того же рака или СПИДа в то время как больше людей умирает от алкоголя, или весь день говорят о каких-то террористах, которые убивают значительно меньше, чем неосторожные водители. Т.е. по мысли автора обществу можно скормить массу глупостей, если общество недостаточно математически образованно.

Впрочем, тут я должен сказать, что везде свои тонкости. Скажем, для меня проблема рака явно острее проблемы алкоголя, потому что пить или не пить -- личный выбор каждого, а вот от рака никто не застрахован, поэтому эмоционально рак меня беспокоит больше.

В этой главе нас тоже ждёт набор занимательных фактов. Например, обсуждается "возврат к среднему". Сиквел хуже гениального оригинала, дети умнейших родителей не столь умны, забив два гола подряд из сложной ситуации на третий раз уж точно промахнёшься. Не стоит здесь искать каких-то особенных законов природы; налицо всего лишь обычное стремление от редкого к средневероятному.

Ещё мне понравилась идея логарифмической шкалы безопасности. Как объяснить простому человеку, какова опасность того или иного занятия? Если 1 человек из N погибает в результате некоторого действия в год, "индекс безопасности" действия можно вычислить как десятичный логарифм от N. Например, в результате вождения автомобиля погибает 1 человек из 5300. Значит, индекс безопасности вождения равен lg 5300 = 3.7. (Чем выше значение, тем безопаснее действие). Аналогично, для курения этот индекс равен lg 80 = 2.9. Понятно, что в расчётах нужно учитывать не общее население страны, а именно людей, практикующих или потенциально участвующих в анализируемых действиях. Ходить по канату без страховки или играть в русскую рулетку очень опасно, однако не так много людей погибает в результате этих действий ежегодно.

5. Статистика. Интересная глава, достаточно сильно пересекающаяся с материалами Хаффа. Моё внимание здесь больше всего привлекли следующие темы.

Дилемма заключённого и связанные задачи. Тут речь идёт скорее о человеческой психологии. Рассматривается целый ряд задач, сводящихся к одной и той же дилемме: как поступит человек, если сотрудничать выгодно, не сотрудничать невыгодно, а выгоднее всего извлечь бонусы из попытки сотрудничества второго партнёра? В классической задаче обсуждается поведение двух подследственных, которые знают, что выгодно молчать (дадут небольшой срок) и не выгодно сдавать подельника (если оба сдадут друг друга, каждый получит большой срок), но выгоднее всего сдать подельника, который не сдаёт тебя, потому что тогда тебя выпустят, а его посадят.

Вариаций у задачи масса. Например, некто хочет быстро купить нелегальный товар. Сумка с товаром обменивается на сумку с деньгами, после чего участники расходятся. Выгодно сотрудничать (т.е. совершить честный обмен), но ещё выгоднее "кинуть" вторую сторону, подсунув пустую сумку. Однако если оба участника будут рассуждать таким образом, то ничего не получат.

Доверительные интервалы. Жаль, о них сказано здесь совсем немного, а ведь тема важная: насколько можно доверять данной выборке.

Непрямые оценочные методы. Например, мы хотим выяснить мнение людей по некоторому интимному вопросу (для простоты будем считать, что возможен ответ в форме "да/нет"). Если задавать вопрос прямо, многие либо откажутся отвечать, либо соврут. Предлагается следующий метод: респондент подбрасывает монетку и отвечает честно, если выпал орёл, если же выпала решка, респондент отвечает "да". Таким образом, мнение каждого конкретного индивидуума остаётся скрытым, но общую картину оценить можно, понимая, что половина опрошенных отвечает "да" просто выбросив орла.

Интересен и метод "пометить-выпустить". Сколько карпов в пруду? Ловим некоторое количество карпов, метим их, выпускаем на волю. Через некоторое время ловим некоторое количество случайных карпов, оцениваем долю помеченных, составляем пропорцию, получаем примерную оценку.

Ещё один пример некорректной оценки события. В газете пишут: "из 28 совершивших самоубийство подростков 10 играли в компьютерную игру X". Что это значит? Пока ничего, потому что нужно оценить типичные показатели самоубийств и популярность данной игры (может, в неё вообще все подряд играют, поэтому связи между игрой и самоубийством нет никакой).

Различие между статистической и реальной значимостью. Допустим, в результате экспериментов доказано, что некоторое лекарство избавляет от головной боли в 3% случаев. Это статистически достоверные данные, но реальная эффективность препарата невысока.

Tags:

Leave a comment
Продолжаем знакомство с Португалией тремя небольшими альбомами: Синтра, Белен, Коимбра.

Tags:

Leave a comment
Не знаю, почему это так, но прелестно! :)

Leave a comment
Выкладываю, наконец, два фотоальбома из Лиссабона (январь 2014 года):

1) Alfama - Baixa - São Jorge Castle.
2) Alfama в деталях.

Tags:

Leave a comment
N. Duarte - Slide:ology: The Art and Science of Creating Great Presentations. O'Reilly, 2008.

Коротко говоря, это очень хорошая книга, которую я могу порекомендовать всем, кому приходится выступать с презентациями. В моём случае, как и в прошлый раз, придётся ограничиться очень ограниченной выжимкой. Автор пишет практически о всех аспектах хорошей презентации -- начиная с подготовки с учётом особенностей ожидаемой целевой аудитории и кончая чисто техническими подробностями выбора шрифта и количества слов на слайде.

Надо сказать, что книга ориентирована прежде всего на бизнес-презентации. Там немного другие акценты по сравнению с выступлениями на научных конференциях. Так что следует читать, не забывая об этих различиях. Ну а поскольку технические аспекты научных презентаций мне хорошо знакомы, сконцентрируюсь лишь на очень небольшой части книги, посвящённой цветам и визуальным элементам.

1. Автор рекомендует выдерживать все слайды в единой цветовой гамме, теме, стилистике, композиции. Для начала хорошо бы выбрать палитру основных цветов и придерживаться её. Хорошо, если удастся взять палитру "из индустрии", то есть выбрать цвета, ассоциирующиеся с темой.




2. Если есть возможность, фотографии лучше делать самостоятельно. Внимание зрителя концентрируется на "узловых" точках, расположенных в углах центрального квадрата (нужно мысленно разбить снимок на девять квадратов), поэтому наиболее важные элементы снимка должны размещаться именно там.

3. Иногда имеет смысл листать слайды не слева направо, а в пользовательской последовательности, если логика действия требует перехода "вверх" или "назад".

4. Полезным элементом слайдов могут служить несложные человечки (рисовать лучше начинать с туловища):



5. В качестве "опорных идей" для основных визуальных элементов презентации предлагаются следующие объекты:











Tags:

Leave a comment
Iliinsky N., Steele J. - Designing Data Visualizations. O'Reilly, 2011.

Это добротная и краткая, без особой воды, книга по визуализации данных, которую я готов порекомендовать интересующимся. В моём случае, к сожалению, здесь нового не очень много, поэтому полноценную выжимку сочинять не буду. Достаточно остановиться на отдельных ключевых для меня моментах.
1. Приводится хорошая сводная таблица типичных графических элементов визуализаций. Отражены следующие сведения: а) суть элемента; б) существует ли "естественный порядок следования" для данного типа элемента; в) количество потенциально различных элементов; г) пригодность для числовых данных; д) пригодность для отражения порядка следования одного за другим; е) пригодность для отображения различных категорий; ж) пригодность для отражения связи между объектами.

Эта же таблица дана в книге в виде "плитки":

2. Авторы напоминают, что у цветов нет "естественного" порядка следования и в очередной раз предостерегают от неаккуратного использования круговых диаграмм любых видов. Раскритиковали, кстати, диаграмму свободного пространства диска, которая мне вполне нравится:
(Интересно, а какую альтернативу они видят? Treemap? Вот хоть убейте, в данном случае мне круг больше нравится.)
3. Приводится неплохой список основных видов диаграмм:
Quantitative and comparative formats

  • Bar graphs & histograms: способ "по умолчанию" для сравнения данных внутри категорий или между категориями; больше подходят для дискретных значений (для непрерывных обычно лучше графики).

  • Line graphs: способ "по умолчанию" для непрерывных данных.

  • Time series: изменение данных во времени.

  • Pie graphs: сравнение частей некоего целого; подходят для небольшого количества частей и невысоких требований к точности (альтернатива -- stacked bar graphs).

  • Scatter plots: анализ корреляций между двумя численными сериями данных, либо для отображения серии двухкомпонентных численных данных; дополнительные измерения можно закодировать пузырьками или круговыми диаграммами.

  • Tables: используются там, где важна точность числовых данных.

  • Periodic tables: годятся только для периодических данных.

  • Treemaps: пригодны для одновременного отображения иерархических и пропорциональных отношений.

  • Heat maps: удобны для показа изменений в больших объёмах данных.

  • Small multiples (наборы упрощённых графиков): пригодны для быстрого отображения потенциально интересных данных, которые могут быть проанализированны более детально в дальнейшем.

  • Marimekko graphs: используются для одновременного отображения дискретных данных по двум осям (авторы, однако, не обсуждают данный вид диаграмм).

Relational formats

  • Data flow diagrams, Entity Relationship Diagrams, etc: отображение потоков данных, последовательностей действий и т.п.

  • Decision maps and flow charts: отображение процесса принятия решений.

  • Social network graphs: отображение отношений между объектами.

Spatial formats

  • Geographic map: отображение данных с привязкой к регионам.

  • Non-geographic map: метафорические карты с данными.

Good uses of circles and circular layouts

  • Cyclical relationships: отображение циклических по своей природе процессов.

  • Direction: отображение направлений (ветра, напр.)

  • Pie graphs: грубое отображение соотношений между небольшим количеством частей.

  • Area on bubble graphs: третье измерение в scatter plot-диаграммах.

Bad uses of circles and circular layouts

  • Circular length and circular bar graphs: длина окружности -- плохой способ отображения длины (за редким исключением).

  • Pies with many or similarly-sized wedges: уже рассмотрено выше.


4. Приводится список из 12 простых контрастных цветов, которые должны использоваться в первую очередь.
По поводу цветов мы ещё поговорим в заметках о книге Slide:ology.

Tags:

Leave a comment
Наконец-то у меня дошли руки до этой очень известной книги (впервые издана аж в 1954 году).

Если коротко, то автор перечисляет основные сложности, с которыми сталкиваются составители всевозможных статистических таблиц и графиков, а также нехитрые приёмы, позволяющие представить данные в наиболее выгодном для составителя виде.
Человеку с техническим образованием книга вряд ли откроет какие-нибудь новые знания; кроме того, способы представления информации за последние 50 лет заметно усложнились, и всяко-разных приёмчиков поприбавилось, так что не помешало бы материал книги расширить и переосмыслить. Тем не менее, круг проблем аккуратно очерчен, и напомнить потенциальные ловушки полезно даже специалисту.

Попробую их кратко обобщить по главам.

1. Нерепрезентативные или необъективные исходные данные.
Получить "честную" выборку из интересующей нас группы может оказаться совсем непросто. Например, в книге приводится утверждение из газеты: "среднестатистический выпускник Йельского университета 1924 г. зарабатывает $25111 в год (т.е. очень прилично)". Автор рассуждает: откуда в начале 50-х можно получить сведения о выпускниках 1924 года? Вероятно, это не просто среднестатистические выпускники, а достаточно успешные люди, которые так или иначе засветились в каких-либо справочниках или картотеках. Аналогично, в 1936 году журнал "Literary Digest" провёл масштабный опрос по поводу грядущих президентских выборов, предсказавший бесспорную победу губернатора Лэндона. Опрос проводили по двум каналам: по телефону и по анкетам, распространяемым среди подписчиков вместе с журналом. Таким образом, респондентами оказались небедные люди, которые могли позволить себе телефон или подписку на журнал (а это времена Великой депрессии), чьё мнение не было репрезентативным. Как мы знаем, тогда уверенно победил Рузвельт.

Подпортить исходные данные могут и чисто психологические факторы. Сколько раз в день вы чистите зубы? Какие книги вы любите читать? -- это вопросы, которые провоцируют не всегда честные ответы: люди могут ответить неискренне, желая произвести более благоприятное впечатление на интервьюера. Аналогично, ответы на вопросы о расовой дискриминации могут существенно зависеть от цвета кожи интервьюера и респондента. А уж получить репрезентативную выборку населения страны или даже города, совсем непросто. Впрочем, насколько я могу судить, за последние 50 лет в этой области был достигнут определённый прогресс.

2. "Среднее".
Чем дальше распределение величин от нормального, тем больше различие между средним арифметическим и медианой. Этот факт может использоваться манипулятивно: если нужно доказать, что зарплаты неплохи, берём среднее арифметическое -- и за счёт отдельных богачей подтягиваем итоговй показатель; если нужно доказать, что люди живут плохо, берём медиану, получая зарплату, до которой добралась половина сотрудников. Иногда используют моду, то есть наиболее часто встречающуюся зарплату среди всех. Автор пишет, что в литературе под словом "среднее" могут пониматься разные показатели, и не всегда легко выяснить, какой именно показатель был использован в конкретном случае.

3. Выброшенные данные.
По моим представлениям, первые два пункта можно ещё списать на добросовестные заблуждения или на мошенничество в рамках дозволенного. Здесь же автор описывает малоприличные практики, когда неудобные цифры попросту выбрасывают. Например, некая фирма утверждает, что эксперимент на сотне добровольцев доказывает, что зубная паста А более эффективна против кариеса по сравнению с "обычной" зубной пастой. Этот результат можно получить нехитрым способом: проводим эксперимент десять раз, берём лучший результат и печатаем его, а про остальные девять "забываем". Чем меньше группа добровольцев, тем проще получить данные с большой (в процентах) ошибкой. Автор пишет, что в хороших отчётах обычно публикуют показатели надёжности оценки (хотя я сам такое вижу не очень часто).
Также автор сокрушается, что нечасто публикуют отклонение реальных данных от полученного среднего значения. Например, "средний размер семьи" в 3.6 человека вовсе не означает, что обычный размер семьи -- три или четыре человека. На практике (для США начала пятидесятых) такие семьи составляли лишь 45% от общего количества семей. Ещё 35% составляли семьи из 1-2 человек, а 20% -- семьи из четырёх и более человек.
Аналогично, не всегда публикуются интервалы нормальных или допустимых значений. Например, если мы знаем, что по статистике в среднем ребёнок научается сидеть прямо в таком-то возрасте, это ещё не повод делать выводы относительно своего собственного ребёнка: необходимо знать интервалы нормы, а не только среднее значение. Впрочем, из личного опыта могу подтвердить, что сейчас показатели развития детей печатают в достаточно развёрнутом виде.
(Совсем уж за пределами разумного публикация графиков с неподписанными осями, даже не будем об этом говорить).

4. Бессмысленные данные.
В этой короткой главе автор напоминает, что у любого метода существует допустимая ошибка измерения, и мы должны принимать её в расчёт. Скажем, если IQ тест прогнозирует оценку "интеллекта" с точностью в 3%, то любой результат следует интерпретировать в рамках обещанного интервала. Если один испытуемый выбивает 98 баллов, а другой 101, мы не можем ничего сказать об их относительной "интеллектуальности", потому что IQ первого находится в рамках 95-101, а второго -- в рамках 98-104.

5-6. "Волшебные" графики и рисунки.
Здесь мы встречаемся с известным набором претензий к графикам. Он многократно описан, например, у Тафти. Не хочу повторяться, я уже Тафти конспектировал. В книге Хаффа подробно изучаются лишь два "метода" получения удобной для себя картинки: а) произвольное обрезание и растягивание графика; б) использование рисунков разного размера для иллюстрации численных соотношений величин.

7. Ложное приравнивание
Здесь речь идёт о том, что нередко явно или неявно доказывают одно, а рапортуют другое. Вместо заявлений о том, что лекарство лечит простуду (доказать не удалось) нам сообщают, что оно "в пробирке убивает 31,180 микробов за 11 секунд". Говоря прямо, эти знания нам мало что дают. Встречаются и более тонкие случаи. Например, можно попытаться выявить распространённость расизма, спрашивая людей о том, имеют ли чёрные и белые одинаковые шансы на трудоустройство. При этом стоит иметь в виду, что исследования показывают: люди с расовыми предубеждениями чаще отвечают на этот вопрос "да", а те, кто против дискриминации, чаще отвечают "нет", сочувствуя чёрным. (Автор приводит ещё несколько банальных примеров из рекламы вроде "выжималка Х выжимает сок на 26% лучше" -- неясно, лучше чего и что это значит; но не будем тратить время на очевидную ерунду).
Сюда же Хафф относит и всякие утверждения вроде "в этом году в авикатастрофах погибло больше людей, чем в 1910 году" (потому что самолётов больше стало) или "в ясную погоду аварии случаются чаще, чем в туманную" (потому что в Калифорнии, где живёт автор, больше солнечных дней). Говорим одно, а подразумеваем другое. Причём это другое желательно не проговаривать, чтобы не поймали на вранье.
Нередко лукавят фирмы, когда рапортуют невысокий доход с продаж, умалчивая доходы от инвестиций или тому подобные вещи. Или вот: "мы имеем с продажи продукта всего 1% прибыли", при этом среднестатистический читатель вспоминает что-нибудь вроде годового банковского процента, хотя в случае с продажами речь может идти о ежедневном (!) доходе, если товар хорошо продаётся. В книге приводится множество сравнений "яблок с апельсинами": смертность в армии сравнивается со смертностью на "гражданке" (хотя в первом случае мы имеем дело только с молодыми здоровыми парнями), минимальный доход учителя в целом штате сравнивается со средним доходом учителя в городе Нью-Йорке спустя несколько лет, "всплеск" болезни может на практике объясняться совершенствованием диагностических методов и т.п.

8. Корреляция и причинно-следственные связи.
Это очень благодатный материал для рассуждений. Если переменные А и Б связаны, не так уж и просто объяснить происходящее: А вызывает Б, Б вызывает А, либо А и Б объединены неким третьим фактором. Например, фраза "курильщики хуже учатся в колледже" может означать не только то, что курение плохо влияет на голову, но и, например, что плохие студенты нервничают, вот и курят. Или эти ребята курят в клубах и на вечеринках, предпочитая их учёбе.
Или вот: у кого много денег, у того много акций. Спросим себя: где здесь курица, а где яйцо?
Также нельзя забывать, что корреляция может наблюдаться лишь в рамках определённых границ: больше дождей -> больше урожая, но слишком много дождей -> меньше урожая.
Автор приводит здесь массу интересных примеров, не будем здесь их обсуждать. Думаю, смысл происходящего и так ясен.

9. Манипуляции статистикой.
Пожалуй, эта глава сродни третьей в том смысле, что здесь тоже обсуждаются случаи явного жульничества, ну или уж очень высокой некомпетентности. Например, в книге приводится прекрасная картинка, на которой расходы государства сравниваются с доходами отдельных штатов США. Если хочется показать, что расходы высоки, закрашиваем западную часть страны: штаты большие по площади, а населения мало, так что итоговый доход не столь уж велик. Если хочется доказать обратное, берём несколько небольших богатых штатов на северо-востоке. Получается, что все государственные расходы равны доходам всего лишь нескольких мелких территорий.
Ещё хороший пример: как можно посчитать средний доход семьи? Например, так: берём суммарные доходы людей, делим на население страны (получается средний доход человека), умножаем на средний размер семьи. Получается, что семья в идеале должна состоять только из взрослых работающих людей.
Сюда же автор относит избыточную точность (вернее, "точность"). Например, спросим сотню человек, как долго они спят ночью. Получим набор довольно неточных ответов (никто ведь не будет высчитывать до минуты). Просуммируем, разделим на сто, получим цифру с тремя знаками после запятой -- выглядит внушительно, хотя доверия к этому значению никакого. Аналогичную "точность" можно получить, высчитывая проценты от небольших величин (эта практика мне, к сожалению, самому хорошо известна).
Автор приводит ещё несколько примеров похожих манипуляций -- очевидных и менее очевидных. Если мы подняли цену на 20%, а затем снизили на 20%, то к исходной цене мы, понятно, не вернёмся. Если каждый компонент хлеба подорожал на 10%, то хлеб тоже подорожает на 10%, а не на сумму процентов. Менее очевидный пример: процентиль. Студент, входящий в 1% лучших может быть значительно лучше студента, входящего в 90% лучших. При этом студенты, попадающие в диапазон 40%-60% могут быть практически неразличимы, если принять распределение оценок за нормальное.

При анализе данных автор рекомендует задавать себе следующие вопросы:

- Откуда взяты данные? Если автор ссылается на известную лабораторию или университет, то кому принадлежат формулируемые выводы -- автору или лаборатории?
- Каким образом получены данные? (Возвращаемся к первой главе).
- Какие данные отсутствуют? (Главы 3 и 4).
- Меняется ли тема по ходу изложения? (Глава 7).
- Нельзя ли прикинуть надёжность данных на простых примерах? (Здесь автор приводит аргумент, который часто звучит сейчас в России: нельзя повышать пенсионный возраст, потому что с учётом нынешней продолжительности жизни до пенсии "никто не доживёт". По мысли автора, основная ошибка в том, что продолжительность жизни измеряется по нынешней статистике смертей и, стало быть, не может использоваться для оценки продолжительности жизни сегодняшних молодых людей. Кроме того, автор рассуждает о том, как опасно бездумно продлевать линии трендов "по линейке".)


Напоследок я от себя хочу добавить вот что. Книга эта, конечно, "цифроцентрична", такой она и задумана. При этом на практике не стоит забывать, что вся логика к статистической не сводится. Если рассуждать по книге, то единственный способ доказать смертельность метилового спирта -- это провести масштабное исследование, в котором людей будут заставлять пить метиловый спирт. При этом выборка должна быть большой и репрезентативной.

Tags:

Leave a comment
Думаю, я уделил несправедливо мало внимания барочной опере. Хотя Гринберг отвёл на неё две лекции (и ещё две были посвящены церковным вокальным формам), мне показалось, что здесь в большей степени играли роль всякие частности, сами по себе интересные, но не очень продуктивные в контексте нашего предельно обобщённого разговора. Например, во Франции опера достигла больших высот благодаря личной любви к ней Людовика XIV. Людовик обожал танцы и всяческие костюмированные действа, поэтому французская опера традиционна богата именно танцами и костюмами. Ну и какой отсюда вывод можно сделать? Кто заказчик, тот и прав, вот и все выводы.

Впрочем, не будем упрощать. Как уже упоминалось выше, на становление оперы очень сильно повлияли идеи членов "Камераты", далеко выходящие за рамки чьих-то частных вкусов. "Камерата" подходила к вопросу основательно. Например, Винченцо Галилей (отец Галилео Галилея) сочинил своего рода манифест, утверждающий базовые принципы "правильной" оперной постановки. Вот некоторые тезисы:

  • Греческая трагедия (которую и предполагалось воссоздавать) основана скорее на пении и музыке, нежели на чистом актёрском искусстве. Я не готов здесь обсуждать, как именно выглядело "пение" в древнегреческом театре; важно лишь то, как его представляли себе члены камераты, а представляли они его именно как пение под музыку.

  • Пение было не только хоровым, но и сольным. Сольное пение в целом плохо сочетается с полифонической музыкой, составленной из равнозначных независимых голосов, поэтому в опере требуются другие музыкальные стили. Галилей писал, что полифония даёт хорошо раскрыться композитору, но не певцу.

  • Текст партий должен хорошо восприниматься на слух. То есть вокал здесь не для красоты, а для смысла. Отсюда требование следовать ритму и произносительным нормам обычной речи, избегать всяких украшательств, повторений и т.п. элементов, затрудняющих восприятие.

  • Мелодия должна соответствовать смыслу происходящего, отражать чувства и эмоции поющего. Ну, для нас это очевидно, однако на заре вокально-драматических форм приходилось явно определять цели и методы.

  • Темы постановок берутся из греческой литературы: мифы, сказания, традиционные сюжеты. Недаром первые оперы назывались "Дафна" (1597) и "Эвридика" (1600). Сюжету об Орфее и Эвридике вообще повезло: оперы на его основе неоднократно создавались и в последующие времена.

Чтобы понять, насколько сольное пение в опере начала XVII века отличалось от более традиционных многоголосных сочинений (например, песен-мадригалов), достаточно сравнить мадригал Палестрины и оперную партию Монтеверди.

После того, как поляна очерчена, можно приступить к её освоению. Вообще очень интересно наблюдать, как происходит освоение, казалось бы, уже ясно обозначенного инструмента. Взять любимый гейм-девелопмент: в 1983 году выходит приставка NES, под неё сразу же пишут какие-то игры. И хотя приставка не меняется вообще никак, технический уровень игр неуклонно растёт, и достигает своего пика на мой вкус лишь к началу девяностых годов. То есть вроде бы в 1990-м году наш инструментарий абсолютно тот же, что и в 1985-м, а почему-то так хорошо не получается.

Так же и в опере: да, базовые принципы заложены, но в действии всё ещё чего-то не хватает. В ранних произведениях действо честно разыгрывается под музыку, но авторы ещё не научились (выражаясь языком Дмитрия Быкова) давить коленом на слёзные железы. Основные сюжеты опер основаны на трагедиях: тот же Орфей спускается в Аид, чтобы вывести оттуда умершую возлюбленную. Однако действие линейно движется вперёд, и пострадать всласть публика не успевает. Решение людям нашего времени известно хорошо: надо сделать паузу и осмыслить происходящее. Сейчас в литературе и кино особенно популярны всякого рода "флешбэки" -- они динамичнее, а в ту эпоху ограничивались внутренними монологами героя. В опере это арии, которые появились уже во второй половине XVII века. Вот, например, как умеет давить на слёзные железы Пёрселл (если следить за текстом и сюжетом "Дидоны и Энея", то и вправду душещипательно).

Ещё интересно заметить, как всё на всё влияет. На рост популярности оперы как чисто светского жанра церковь подготовила собственный "ответ Чемберлену": кантаты и оратории. Это по сути были очень похожего типа произведения, только без костюмов, без актёрства, и на основе библейских сюжетов.

Что ж, на этой оптимистической ноте мы, наверно, таки попрощаемся с замечательной эпохой барокко и в следующий раз займёмся классикой в узком смысле этого слова, то есть перейдём к классическому периоду музыки.

Tags:

Leave a comment