которых каждое отдельное значение (иногда их может быть до пятидесяти) отображается отдельным оттенком серого цвета. В принципе это может оказаться довольно ловким способом избежать необходимости установления границ между категориями. Но, как показывает рис. 11.8, оттенки серого могут и не создать упорядоченную последовательность, поэтому приходится сокращать легенду, чтобы она не стала слишком запутанной. Более того, присваивая каждому отдельному значению собственную категорию, можно легко разрушить четкую и легко запоминающуюся картину пространственных трендов. Так что это идеальное решение в конечном счете может и не быть таким уж идеальным.
Рис. 11.8. Не имеющая категорий хороплетная карта с символами, обозначаемыми последовательными оттенками серого цвета, и отображающая данные, приведенные на рис. 11.4
Остерегаясь как обидных просчетов, так и всяческих панацей, проницательный автор карт начинает с постановки перед собой двух вопросов: как распределены данные по всей шкале и какие границы между категориями могут иметь для пользователя особое значение (если таковые вообще есть)? Ответ на второй вопрос зависит от имеющихся данных и от того, считает ли автор карты полезным их сравнение со средними значениями на национальном или региональном уровне. Например, на уровне штатов граница категории, установленная по среднему значению для США, позволит губернатору и сенаторам сравнить ситуацию в штате или избирательном округе и результаты собственной деятельности в них со средними по стране. Разумеется, в легенде карты эта значимая граница должна быть отражена.
Рис. 11.9. Числовая ось, отображающая показатель наличия приборов в одном домохозяйстве на уровне города и основанная на данных, приведенных на рис. 11.4
После рассмотрения вопроса о значимых границах между категориями добросовестный картограф может обратиться к числовой оси, подобной показанной на рис. 11.9. Горизонтальная линия с вертикальными отсечками и символами представляет собой область данных. Каждый кружок показывает значение определенного показателя, причем одинаковые значения размещаются на оси в одном и том же месте друг над другом. Получившаяся диаграмма точно указывает на границы категорий и четкие группы однородных значений, которые в процессе классификации могут не разделяться дополнительно. Числовые оси позволяют автору схемы легко визуализировать распределение значений и выбирать подходящее количество категорий и адекватные границы между ними. Компьютерные алгоритмы тоже могут находить распределение данных по оптимальному набору границ между категориями, но во многих случаях этот определенный компьютером оптимум ненамного лучше визуально осуществленной классификации; округленные границы категорий и более равномерное распределение по ним населенных пунктов могут явиться важными дополнительными позитивными элементами в хороплетных картах.
Очень высокие или очень низкие значения, не подпадающие ни под одну категорию, могут озадачить как картографа, так и передовые картографические программы. Следует ли присоединять эти отклонения к очевидно более однородным группам в более высокой или более низкой части числовой оси? Или, может быть, такие показатели следует помещать в созданные для них отдельные категории? Можно ли объединить два или три сильно расходящихся показателя на любом полюсе числовой оси в одну очень разнородную группу? Или каждое отклонение нужно рассматривать в отдельной категории, с собственными символами, рискуя ухудшить графическую дифференциацию между пространственными символами? Или автору схемы скорее следует относиться к этим статистическим выбросам как изгоям – ошибкам или отклонениям, которые «не вписываются» в схему, – и просто опускать их или присваивать им специальные символы?
Рис. 11.10. Хороплетная карта, составленная на основе данных, представленных на числовой оси на рис. 11.9, и их характере
В отношении резких отклонений показателей не может быть простых стандартных решений. Автор карты или схемы должен хорошо знать все данные, служащие ее основой; знать, являются ли такие отклонения действительными или неправдоподобными, и осознавать, имеют ли значительные разрывы между ними какое-то значение. Важным вопросом является взаимосвязь таких отклонений с темой схемы и интересами ее пользователей. Для соотношений прибор/домохозяйство, изображенных на рис. 11.9, средний показатель 8,9, безусловно, не только исключителен, но еще и значительно выше, чем ближайшее к нему значение 4,2. Если это не ошибка, то такой показатель заслуживает отнесения его к отдельной категории. Следующие более низкие значения: 4,2 (дважды), 3,5 и 2,6 – могут составить другую категорию. Все они выше более внушающего доверие значения 2,0. Но показатель 4,2 вовсе не невероятен, особенно в состоятельных районах.
Другие границы находятся между значениями 0,9 и 1,3. В этом разрыве расположился естественный значимый показатель – 1 (один) прибор на домохозяйство. Следующая категория – между 0,2 и 0,7, в которую попадают семь не любящих технику городов из нижней части списка распределения электронных устройств. Получившаяся в результате хороплетная карта (схема), состоящая из пяти категорий (рис. 11.10), не только точно и правдиво представляет показатели и их статистическое распределение, но и четко отображает их пространственное расположение. Произвольная классификация, характерная, например, для ошибочных категорий, устанавливаемых компьютерными программами, вряд ли даст такой же положительный результат, даже если будет использовать шесть и больше категорий.
Классификация, корреляция и визуальное восприятие
Хороплетные карты часто искажают взаимоотношения между географическим распределением двух связанных тем. Наскоро подобранные или специально сфальсифицированные категории могут снизить визуальное сходство между двумя подобными в своей основе тенденциями или, наоборот, создать видимость подобия между двумя очень отличающимися друг от друга моделями.
Рассмотрим пример, изображенный на рис. 11.11, – пространственно-статистическую таблицу и числовую ось, отображающие среднее число детей на домохозяйство. Этот показатель на уровне городов тесно связан с количеством электронных приборов, приходящихся на одну семью. Хотя разброс данных в показателе числа детей в семье не так велик, как в случае с электронными приборами, наивысшие значения этого индекса расположились справа вверху, а наиболее низкие – в нижней части таблицы. Города, расположенные справа и вверху региона, в целом характеризуются наличием большего числа детей в семьях, чем города, расположившиеся в нижней и левой части карты. Неудивительно поэтому, что две карты на рис. 11.12 показывают одинаковые пространственные картины наличия детей и электронных приборов в домохозяйствах.
Статистики обычно изображают корреляцию при помощи рассеивания значений по двум осям, когда числовые величины одной переменной отмечаются на вертикальной оси, а другой – на горизонтальной. Точка (или кружок) изображает географический пункт, а плотность и ориентация «облака» точек указывает на силу и направление корреляции.
На рис. 11.13 изображены две таблицы рассеивания значений, каждая из которых указывает на плотную положительную зависимость между числом детей в семьях и количеством электронных приборов в домохозяйстве. Вертикальные пунктирные линии, отходящие от осей таблицы и пронизывающие скопления кружков, отображают границы категорий из рис. 11.12. Четыре линии, отходящие от каждой оси, делят всю таблицу на сетку неравных прямоугольников «5×5». Поскольку