CES 2015: Nvidia Tegra X1: самая мощная мобильная видеографика

   Автор статьи: Юрий Стрельченко

Впервые мобильная графика добралась до производительности в один терафлопс.

За последние несколько лет Nvidia демонстрировала особую целеустремленность в мобильной сфере. Так, чипсеты Tegra 2, Tegra 3 и Tegra 4, давшие начало некоторому узкому ассортименту смартфонов и планшетов, предлагали видеографику, которая, увы, отличалась от реализуемой для настольных и портативных компьютеров, будучи функционально ограниченной и с уникальной архитектурой. Однако с появлением Tegra K1 компания резко рванула вперед, поставив на высокопроизводительную видеографическую организацию Kepler, которая по своей сути идентична настольной. Между тем Apple A8X удалось добиться почти такой же производительности работы при меньшем энергопотреблении.

И всё же Nvidia хорошо постаралась. Вслед за чипсетом Tegra K1-32, который перевел Kepler на мобильные рельсы, дебютировал кристалл Tegra K1-64, добавивший 64-разрядный вычислительный ARMv8-процессор Denver вместо 32-разрядных ядер ARM Cortex-A15.

Намеченный к серийному выпуску в 2015 году чипсет Tegra X1 проходит под кодовым обозначением Erista. Кристалл, построенный в рамках 20-нм проектных норм, обратился к вычислительным ядрам ARM Cortex-A57 и Cortex-A53 — соответственно высокопроизводительным и энергоэффективным, и видеографике нового поколения Maxwell.

Четырехъядерный кластер Cortex-A57 дополнен общим 2-Мбайт L2-кешем, а каждое его ядро сопровождает кеш-память первого уровня L1: 48 Кбайт для инструкций и 32 Кбайт для данных. Четырехъядерная группа Cortex-A53 включает общий кеш второго уровня L2 на 512 Кбайт, плюс по 32 Кбайт L1 на ядро для инструкций и данных.

В отличие от стандартной конфигурации ARM big.LITTLE использовано фирменное сочетание, вовлекающее особое межсоединение вместо решения ARM CCI-400, а также кластерную миграцию, а не глобальное планирование задач. Кластерная миграция выделяет пользовательским приложениям ресурсы всех восьми ядер, причем она, будучи согласованной с кеш-памятью, не приводит к потерям по части производительности.

Nvidia утверждает, что скорость Tegra X1 явно опережает таковую у Samsung Exynos 5433 в 1,4 раза из расчета на ватт энергии.

Выбор вычислительных ядер ARM Cortex вместо Denver обусловлен маркетинговыми соображениями: первые уже готовы, тогда как для вывода последнего на рынок потребуется некоторое время, которого в конкурентной обстановке попросту нет. Дело в том, что Denver следует перебросить с 28- на 20-нм технологический процесс. Однако вовсе не факт, что такой подход сэкономит время для Nvidia, ведь интеграция ARM-ядер в кристалл Tegra X1 не относится к столь же простому вопросу, как игра в конструктор Лего. Возможно, Denver появится в составе следующего 16-нм кристалла Parker.

Tegra X1 получил видеографику Maxwell, которая в своей настольной инкарнации в прошлом году вышла в форме видеокарт GM107/GM108 и GM204 — соответственно на базе Maxwell 1 и Maxwell 2. Что интересно, архитектура Maxwell, в отличие от Kepler, вначале разрабатывалась для мобильных чипсетов, и только затем переносилась на настольные системы. Это означает, во-первых, ускоренный цикл производства: между появлением Maxwell 1 и Tegra X1 прошел где-то год, тогда как у мобильной Kepler в Tegra K1 на это ушло почти два года. Кроме того, инженеры смогли внедрить серьезные наработки по части оптимизации энергопотребления еще на ранних стадиях проектирования Maxwell.

Набор возможностей Maxwell 2 в составе Tegra X1 расширен в сравнении с Kepler в Tegra K1. Так, появилось дельта-кодирование третьего поколения, потоковая обработка данных стала эффективнее на каждое CUDA-ядро, реализованы предварительная растеризация, многокадровое сглаживание и прочие штуки.

И всё же самым важным в Tegra X1 стал упор на двух основных моментах по части производительности — расширении пропускной способности памяти и общей эффективности работы. Да, дабы избавиться от расхожего «бутылочного горлышка» можно было бы нарастить ширину шины памяти до 96 или 128 разрядов, но это усложнило бы как сам кристалл, так и поддерживающее оборудование. Nvidia остановилась на 64-разрядной шине, однако привлекла алгоритмы сжатия данных вкусе со скоростными микросхемами LPDDR4.

Чипсет Tegra X1 подключил особую возможность, которая отсутствует в настольной Maxwell: ускоренные вдвое 16-разрядные операции с плавающей запятой (FP16). Важность FP16 на мобильных устройствах определяется тем, что они вовсю используются в Android и играх. Кроме того, Nvidia делает особую ставку на FP16 в алгоритмах распознавания изображений, которые применяются в автомобильной платформе Drive PX.

Nvidia продемонстрировала результаты производительности Tegra X1, доказывая, что новинка и правда получилась ну очень сильной. Работа чипсета показана на эталонной платформе планшетного оборудования с энерговыделением 5 ватт. Как видим, скорострельность Tegra X1 в сравнении с A8X в составе Apple iPad 2 легко обходит видеографику PowerVR GX6850, до сего момента самую мощную.

Вопрос энергопотребления пока не особо понятен, но испытания доказывают замечательную энергоэффективность. Так, в тестах Manhattan бенчмарка GFXBench 3.0, запускаемых в Full HD-разрешении во вне экрана, Maxwell в Tegra X1 потребляет в среднем 1,51 ватт — у видеографики в A8X этот показатель равен 2,67 ватт. Что важно, частота кадров у первого чипсета почти вдвое выше, чем у первого, причем оба они построены в 20-нм рамках.

Помимо вычислительного и видеографического аспектов Nvidia решительно усовершенствовала остальные части Tegra X1 в сравнении с таковыми в Tegra K1. Так, переход от 64-разрядной шины оперативной памяти LPDDR3 к LPDDR4 повысил пиковую пропускную способность с 14,9 до 25,6 Гбайт/с наряду с сокращением энергопотребления в пределах 40%.

Максимально поддерживаемое разрешение дисплея устройства подросло с 3200×2000 до 3840×2160 пикселей на частоте 60 Гц с потоковым сжатием VESA-данных. Для подключаемых внешних экранов реализована работа с интерфейсами HDMI 2.0 и HDCP 2.2, что означает поддержку 4K@60-панелей вместо 4K@30 в случае Tegra K1.

Процессор обработки изображений по части функций в значительной степени подобен на таковой в Tegra K1, зато скорость кодирования и декодирования JPEG повысилась в пять раз: с 120 до 600 мегапикселей/с. Кодирование и декодирование видео отныне поддерживает H.265 и VP9, появились аппаратные блоки для H.264 и VP8 на разрешениях 4K@60.

Контроллер флеш-хранилища умеет обмениваться данными по скоростному протоколу eMMC 5.1.


© СОТОВИК

Новости за день

Авторизация


Регистрация
Восстановление пароля

Наверх