|
::: Главная страница
::: Новости фирмы
::: Наша продукция
::: Прайс - лист
::: Ссылки
::: О фирме
::: Координаты

|
Voodoo Scalable
Architecture
Итак, это свершилось
! 15 марта 2004 года компания 3dfx реорганизовалась и официально
анонсировала свою новую технологию VSA (Voodoo Scalable Architecture),
ранее известную под кодовым именем Napalm, а также первые графические
процессоры и карты, реализующие эту технологию.
В последние 3 года
только ленивый пользователь или обозреватель не пинал компанию 3dfx.
В принципе, было за что пинать, однако компания не сдалась, а продолжала
упорно работать над своим новым детищем. Прежде всего, перед 3dfx
стояла проблема правильного выбора стратегии. Руководителям компании
вместе с инженерным персоналом нужно было решить, какими функциональными
возможностями должны обладать новые продукты 3dfx. Новые продукты
должны сочетать в себе такие черты, чтобы с одной стороны они хорошо
покупались, а с другой стороны 3dfx нужно как минимум остаться среди
ведущих игроков массового рынка 3D графики и как максимум вновь
стать лидером этого рынка. В связи с тем, что продукты конкурентов
обладают определенным набором новых функциональных возможностей,
инженерам 3dfx нужно было создать продукт, по крайней мере, не уступающий
по параметрам. Но этого было бы достаточно лишь для того, чтобы
остаться на рынке. Если же 3dfx хочет вернуть себе место лидера,
новый продукт должен обладать тем, чего нет у конкурентов, но что
очень понравится пользователям или обладать всем тем, что есть передового
и нового у конкурентов, но вместе с тем быть лучше. Плюс ко всему
по сети еще с прошлого года ходили слухи о том, что в лабораториях
3dfx готовится какой то новый чудо продукт с невероятными возможностями. Так или иначе,
но интерес к новому продукту от 3dfx существует довольно давно и
очень устойчивый. Одни с нетерпением и надеждой ждут нового продукта
от любимой компании, другие ждут тоже с нетерпением, в тайне надеясь,
что 3dfx облажается и компания исчезнет с рынка, расчистив дорогу
более сильным конкурентам.
Идея NVIDIA с нагнетанием
таинственности и привлечения всеобщего внимания явно прижилась.
В этом нет ничего плохого, так как все самые удачные идеи конкуренты
всегда перенимают. Самое интересное, что уже в 14:00 по Московскому
времени любознательные пользователи раскопали на европейском сайте
3dfx секретный пресс-релиз со всей информацией о грядущем пятью
часами позже событии. К слову, в первые 30 минут после время "Ч"
сайт 3dfx был явно перегружен обращениями страждущих, немного позднее
ситуация улучшилась. Видимо положительную роль сыграло то, что на
многих сайтах, посвященных компьютерным новостям заранее было все
рассказано, что и снизило поток желающих попасть на сайт 3dfx именно
в 19:00. На мой взгляд, событие с представлением новой архитектуры
VSA и новых графических акселераторов ничуть не потускнело из-за
утечки информации. Стало ли это событие новой вехой в развитии массового
рынка 3D графики, покажет только время. Сейчас мы можем лишь констатировать,
что многие наши прогнозы вновь оправдались и посмотреть более внимательно
на то, что предлагает нам 3dfx. Тем не менее, любой желающий может
отметить этот день для себя как праздник, или просто, хмыкнув, проигнорировать.
Практически все конкурирующие
продукты в области 3D графики поддерживают отображение трехмерной
графики при 32 битной глубине представления цвета, поддерживают
AGP текстурирование и текстуры большого размера, а также еще набор
некоторых функция, ставший как минимум стандартом де-факто. С этими
и другими ставшими уже стандартными параметрами для современных
графических акселераторов в принципе все ясно. Можно вести споры
о том, что часть из функциональных возможностей не поддерживаются
в приложениях, а значит не особо и нужны, но эти споры бессмысленны.
Если сложись мнение, что то-то и то необходимая функциональная черта,
значит, любой продукт должен обладать это чертой иначе asta
la vista baby. Новый продукт от 3dfx просто обязан соответствовать
установленным стандартам на рынке. Но вот что предложить покупателям
кроме стандартного набора возможностей? Заметим, что наличие интегрированного
геометрического сопроцессора мы пока относим к новейшим или нестандартным
функциональным возможностям графических процессоров для массового
рынка. Можно пойти по пути конкурентов и также предложить в своих
новых продуктах аппаратную поддержку расчетов T&L. Известно,
что NVIDIA и S3 пошли как раз по пути интеграции геометрических
сопроцессоров в свои чипы и сделали это первыми в решениях для массового
рынка 3D графики. Этот путь развития, безусловно, верен и есть все
основания предполагать, что через полгода год мы увидим массу игр,
которые будут требовать наличия аппаратного расчета преобразования
координат полигонов и установки освещения. Тем не менее, правильных
путей развития может быть несколько. После анонса технологии T-Buffer
стало совершенно очевидно, что в будущих новых продуктах от 3dfx
будет реализована аппаратная поддержка T-Buffer. Напомним, вкратце,
в чем суть технологии T-Buffer.
Суть технологии T-Buffer
состоит в обеспечении возможности управления несколькими кадровыми
буферами, что позволяет использовать ряд специальных эффектов. Самый
важный цифровой эффект это full scene spatial anti-aliasing (или
просто FSAA). Кроме того, уже сейчас разработаны техники использования
таких эффектов, как motion blur, depth of field, soft shadows и
soft reflectance. Технология T-Buffer это, прежде всего, инструментарий.
Имея возможность управлять рендерингом сразу в нескольких кадровых
буферах, разработчик приложений может создавать свои собственные
специальные эффекты. Для реализации эффекта full-scene spatial anti-aliasing
не нужно каких-либо специальных интерфейсов, для всех других эффектов,
которые можно накладывать с помощью T-Buffer потребуется поддержка
через интерфейсы, которая, впрочем, может быть реализована через
расширения к OpenGL или Direct3D. Главная идея T-Buffer состоит
в обеспечении визуализации более качественной 3D графики. Более
подробно о технологии T-Buffer можно прочитать в этом материале.
После анонса новой
технологии от 3dfx, получившей замысловатое имя VSA-100 стало ясно,
что упор сделан на скорость и качество, а ключевым термином стало
слово Scalable (масштабируемость). Поддержка аппаратного расчета
T&L пока отложена на неопределенный срок.
В принципе, идею инженеров
3dfx легко понять. Зачем делать продукт, часть функциональных возможностей
которого будет использоваться лишь через пол года, а то и через
год? Если компании NVIDIA и S3 хотят быть локомотивами, которые
будут проталкивать идею аппаратной реализации расчетов T&L среди
разработчиков игр, то пусть этим и занимаются. К тому же они еще
и между собой будут конкурировать. Кроме того, весной и NVIDIA и
S3 все равно выпустят следующее поколение своих GPU, а тогда к конкурентной
борьбе может подключиться и компания 3dfx. Конечно, если картина
с поддержкой аппаратной реализации T&L в играх станет очевидной.
Если весной все еще будет не ясно, нужны ли на массовом рынке графические
карты с геометрическими сопроцессорами на борту, никто не мешает
отложить 3dfx анонс поддержки аппаратного расчета T&L до осени
2004 года. Если же уже весной 2004 станет очевидно, что аппаратная
поддержка T&L является необходимой функциональной чертой графических
акселераторов для массового рынка, никто не мешает 3dfx установить
на свои карты внешний геометрический сопроцессор. Замечу, что, на
мой взгляд, пока логичнее вести речь именно о внешнем геометрическом
сопроцессоре на платах от 3dfx. Причин тому несколько. Во-первых,
если верить неподтвержденной официальными источниками информации,
3dfx уже ведет работы по использованию в своих продуктах внешнего
геометрического сопроцессора IMPAC-GE от Mitsubishi. Основная
проблема с такой реализацией это поддержка в драйверах. Главный
плюс - минимальные затраты на разработку, т.к. чип IMPAC-GE существует
и присутствует на профессиональном графическом рынке уже более года,
т.е. это отлаженное решение. Во-вторых, можно пересмотреть дизайн
продуктов сери VSA и интегрировать в них геометрический сопроцессор.
Главный минус такого решения это большие затраты на разработку,
дизайн и отладку, т.к. все нужно фактически делать с нуля (если,
конечно, эти работы уже не ведутся). Плюсом такого решения является
его потенциальная вычислительная мощность, читай производительность.
Дело в том, что ключевой особенностью архитектуры VSA является масштабируемость,
т.е. подразумевается, что на одной плате может быть установлено
параллельно несколько графических процессоров. Если в каждом процессоре
будет интегрированным свой геометрический сопроцессор, то в итоге
мы получим суперкомпьютер в формате AGP карты. С другой стороны,
никто не мешает установить на одной PCB несколько геометрических
сопроцессоров, главное, чтобы хватило электропитания и места на
карте. При этом идеология технологии SLI может быть применена и
к параллельным вычислениям, выполняемым сразу несколькими геометрическими
сопроцессорами. Какой путь на самом деле выберет 3dfx, покажет только
время. Тем не менее, приведу высказывание CTO компании 3dfx Скотта
Селлерса (Scott Sellers): "3dfx will have HW T&L when it
matters in the market". Проще говоря, когда аппаратная поддержка
T&L будет необходима на рынке, мы ее реализуем.
Архитектура VSA
VSA расшифровывается
как Voodoo Scalable Architecture, что по-русски звучит как масштабируемая
архитектура Voodoo. Сразу можно отметить, что 3dfx не отказалась
от хорошо раскрученной марки Voodoo. Это вполне логичное и ожидаемое
решение. По крайней мере, это экономит деньги на рекламу, а режим
экономии сейчас очень необходим для 3dfx, особенно в свете того,
что продажи карт серии Voodoo3 не обеспечивают достаточных доходов,
а новые карты появятся на рынке лишь весной 2000 года, уже после
новогоднего пика продаж на массовом рынке. Первый чип, реализующий
архитектуру VSA, получил имя VSA-100. Простое, незамысловатое название.
Итак, в чем же заключается
масштабируемость новой архитектуры? Масштабируемость VSA заключается
в возможности параллельной работы от 2 до 32 графических процессоров.
При этом параллельная работа графических процессоров может использоваться
двумя методами.
Первый метод подразумевает
использование технологии SLI (scan line interleave), хорошо известной
со времен классического чипсета Voodoo2. Во времена Voodoo2 технология
SLI представляла собой следующее: два графических процессора осуществляют
рендеринг разных строк одного кадра, формирующих конечное изображение.
При этом все чипы используют один общий кадровый буфер. Затем сформированный
кадр выводится из общего кадрового буфера на экран монитора. Архитектура
VSA поддерживает новую реализацию технологии SLI, в которой устранены
такие ограничения старого варианта SLI, как использование только
двух графических чипсетов параллельно и отсутствие поддержки разрешений
более чем 1024х768 (теперь поддерживаются разрешения вплоть до 1600х1200).
Более того, новая версия технологии SLI представляет собой совершенно
другую идеологию. В силу того, что современные графические ускорители
ориентированы на использование AGP интерфейса, а по заявлению 3dfx
чип VSA-100 специально оптимизирован на работу с AGP, теперь режим
SLI ориентирован на реализацию протокола взаимодействия нескольких
графических процессоров, расположенных на одной PCB. В случае с
VSA-100 новая версия технологии SLI позволяет обеспечить совместную
работу в параллельном режиме до 32 графических процессоров. Теперь
каждый чип, работающий в режиме SLI, может заниматься формированием
определенной последовательности или полосы из строк одного кадра,
а каждая такая последовательность может содержать от 1 до 128 строк.
При этом число строк в последовательности или полосе, может динамически
изменяться. Речь идет о том, что каждый чип формирует строки, которые
идут подряд и составляют полосу, а из набора полос формируется полный
кадр. Например, если мы имеем четыре чипа, работающих в режиме SLI,
то каждый чип может формировать полосы из 40 строк каждая, которые
все вместе сформируют кадр. Разумеется, можно использовать и режим
чередования строк, а не последовательностей строк. Например, в случае
4 процессоров в режиме SLI присвоим каждому чипу индекс CN, где
N=1, 2, 3, 4. Тогда чип C1 будет формировать строку S=1, 5, 9 и
т.д. или S=4*M+N, где M=[0...1200], а N соответствует номеру графического
процессора.
Зачем понадобилось
использовать именно полосы с возможностью изменения количество строк
содержащихся в них? В зависимости от глубины представления цвета,
числа полигонов в сцене и их расположения, возможность изменять
число строк составляющих полосы позволяет оптимальным образом загружать
и использовать технику SLI. При этом возможна ситуация, когда формирование
маленького полигона может выполняться полностью одним графическим
чипом и в пределах одной полосы строк. В такой ситуации использование
SLI будет неэффективным. С другой стороны, если графический чип
формирует больше одной строки сразу, т.е. полосу, это позволяет
загружать более равномерно всю систему и эффективно использовать
текстурный кэш. В итоге, было решено использовать полосы, в которых
число строк динамично изменяется от 1 до 128, что обеспечивает равномерную
загрузку системы работающей в режиме SLI.
Замечу, что каждый
из чипов VSA-100, используемых в режиме SLI имеет собственный кадровый
буфер, в котором осуществляется рендеринг строк или последовательностей
строк (полос), после чего данные из разных кадровых буферов передаются
в общий кадровый буфер, где формируется полный кадр и уже оттуда
происходит вывод на экран монитора. При этом каждый чип VSA-100
имеет собственную шину памяти и собственный локальный кадровый буфер.
Напомню, что каждый чип VSA-100 поддерживает работу с локальной
видеопамятью объемом до 64 Мб. Часть доступной для каждого чипа
памяти используется под кадровый буфер (с двойной или даже тройной
буферизацией), а остальная память используется для хранения текстур
и Z-буферизации. На тот случай, если доступных объемов памяти окажется
мало, 3dfx рекомендует использовать один из двух поддерживаемых
методов компрессии текстур: DXTC или FXT1. Такая организация работы
графических процессоров способствует более равномерному распределению
нагрузки на полосу пропускания шины памяти. Кстати, благодаря такому
решению, когда потоки данных равномерно распределяются между графическими
процессорами, работающими в режиме SLI, суммарная ширина полосы
пропускания памяти существенно возрастает. Именно поэтому, вполне
допустим вариант использования стандартной памяти SDRAM/SGRAM, как,
вероятно, и будет на самом деле.
Второй метод подразумевает
использование технологии T-Buffer. В этом случае каждый графический
процессор формирует полностью один кадр изображения в собственном
кадровом буфере. После чего T-Buffer производит совмещение содержимого
нескольких кадровых буферов и выводит полученный результат на экран
монитора в виде единого кадра. Не буду повторять, какие возможности
предоставляет использование T-Buffer , просто напомню, что главное
это улучшение качества и восприятия графики. Улучшение качества
достигается за счет аппаратной реализации сглаживания всей сцены
(full scene anti-aliasing), а восприятие улучшается за счет применения
специальных эффектов типа depth of field, soft shadows и т.д.
Остается один важный,
на мой взгляд, вопрос. Будет ли возможность одновременно использовать
T-Buffer и режим SLI? Судя по всему да, такая возможность будет,
но работать все это будет по-разному в конфигурациях с двумя и четырьмя
(и более) чипами VSA-100. И вот почему. Для реализации аппаратного
эффекта full scene anti-aliasing для формирования конечного пикселя
изображения используется четыре пиксельных семпла. В случае, когда
на карте используется только два чипа VSA-100, за один такт они
могут сформировать как раз 4 пиксельных семпла, но не более, т.е.
использовать чередование строк или полос из строк это просто лишняя
потеря времени. С другой стороны, действие эффектов T-Buffer может
применяться не к полному кадру, а лишь к его определенной части.
В этом случае, видимо, допустимо использование техники чередования
строк для оптимизации нагрузки на шину памяти, а значит можно одновременно
использовать T-Buffer и режим SLI. Если все эти предположения верны,
то для оптимальной работы T-Buffer, а значит аппаратного применения
эффекта FSAA (full scene anti-aliasing) и других специальных эффектов
без ощутимого урона общей производительности, т.е. с применением
техники SLI, требуется использование не менее четырех процессоров
VSA-100 одновременно. В случае использования лишь двух процессоров
VSA-100 техника SLI будет применяться ограниченным образом, либо
вообще не применяться, если задействован T-Buffer, либо будет применять
только режим SLI для достижения максимальной производительности
и при этом полностью не будет задействован T-Buffer.
Если все эти идеи
верны, то пользователь получит возможность выбирать между высокой
производительностью и высоким качеством и реалистичностью изображения.
Косвенно это подтверждается тем, что по заявлению3dfx у пользователя
будет возможность отключения T-Buffer (а значит отключения аппаратной
реализации эффекта FSAA), чтобы получить максимальную величину fillrate,
а значит максимальные значения fps. Поясню важную деталь. Если пользователь
выберет для себя режим наивысшего качества графики и наилучшего
восприятия изображений на мониторе, читай, решит использовать технологию
T-Buffer, это вовсе не означает, что он проиграет в скорости. По
крайней мере, 3dfx обещает, что высокое качество графики и реализм
изображений при использовании специальных эффектов типа motion blur,
depth of field и т.д. не скажется на величине fillrate. Проще говоря,
наряду с высоким качеством графики и использованием специальных
эффектов пользователь получит высокую частоту смены кадров на экране,
например 60 fps при разрешении 1024х768 и с использованием T-Buffer.
Если пользователю плевать на специальные эффекты и его устраивает
обычное качество графики, которое обеспечивают продукты от NVIDIA,
Matrox или ATI, но не хватает скорости и хочется получить сумасшедшие
значения fps, то достаточно отключить T-Buffer и включить режим
SLI.
Отметим один важный
момент. По сравнению с технологией MAXX от ATI у технологии
SLI от 3dfx нет такой проблемы, как возможное возникновение лага.
Отсутствие проблемы связано с тем, что в случае с режимом SLI графические
процессоры каждый раз занимаются формированием текущего кадра, не
выполняя работы впрок.
Теперь уместно рассмотреть
параметры первого чипа, реализующего архитектуру VSA.
Общие данные VSA-100
- Интегрированный 128 разрядный
2D/3D/Video ускоритель
- Чип содержит 14 млн. транзисторов,
изготавливается по 0.05 мкм технологическому процессу с использованием
шестислойной технологии
- Частота графического ядра
166 - 183 MHz (в зависимости от типа используемой памяти)
- 2 конвейера рендеринга с 2
блоками текстурирования на каждом (вопрос спорный, есть мнение,
что каждый конвейер имеет лишь один блок текстурирования)
- Fillrate 333 - 367 млн. пикселей
в секунду (включая режим мультитекстурирования)
- Интегрированный 350 MHz RAMDAC
(возможно будет использоваться 400 Мгц RAMDAC)
- Рендеринг при 32-битной глубине
представления цвета
- 24-бит Z & W буферы,
- 8-битный стенсель буфер
- Текстуры с 32-битной точностью
представления данных и размером вплоть до 2040x2048 пикселей
- Предположительно 128 разрядный
интерфейс памяти
- Один чип VSA-100 поддерживает
до 64 Мб локальной видео памяти типа SDRAM/SGRAM и возможно
DDR SDRAM/SGRAM
- PCI 2.2 и AGP x2/4x с SBA
и DME
- Максимальное разрешение 2048x1536@85Hz
3D часть
Поддерживается весь
набор функций как у серии Voodoo3 и плюс к этому:
- Мультитекстурирование за один
проход и один такт
- Рельефное текстурирование
за один проход и один такт
- Трилинейная фильтрация за
один проход и один такт
- Попиксельный mip-mapping и
режим альфа смешивания
- Поддержка 8-битных палетизированных
текстур (гарантирует высокую совместимость с играми и не снижает
общей производительности)
- Наложение табличного и попиксельного
тумана
- Поддерживается "triangle strips
and fans" (При наличии смежных треугольников, не требуется передавать
информацию о всех трех вершинах каждого из них, а просто передаются
данные сразу о последовательность треугольников, для каждого
из которых определяется лишь одна вершина. В результате снижаются
требования к ширине полосы пропускания шины памяти)
- Динамичное наложение текстур
окружающей среды
- Поддерживаются все режимы
смешивания текстурных цветов описанные в DX6, DX7 и OpenGL 1.2
- Поддерживаются технологии
компрессии текстур DXTC и FXT1
Программная часть
- Драйверы с поддержкой интерфейсов
DirectX, OpenGL и Glide (обещается, что новый ICD OpenGL позволит
работать с профессиональными графическими приложениями)
- Поддерживаются ОС Windows
95, 98, NT4.0 и Windows 2000
Первое, что вызывает
вопросы, это почему чип VSA-100 будет производиться по 0.05 мкм
процессу и это в первом квартале 2004 года, когда конкуренты собираются
переходить на 0.13 мкм процесс. Уже сейчас S3 использует 0.13 мкм
технологию при производстве своих чипов Savage2000, а GPU GeForce
256 от NVIDIA производится по 0.22 мкм технологическому процессу.
Ответ на этот вопрос дал Скотт Селлерс в интервью сайту "Thresh's
FiringSquad". Вот что сказал Скотт: "NVIDIA использует
пятислойный металлический 0.22 мкм процесс, что обеспечивает меньшие
размеры кристалла и более низкое энергопотребление. Мы используем
шестислойный дизайн и улучшенный 0.25 мкм технологический процесс,
что позволяет уменьшить размер кристалла по сравнению с обычным
0.05 мкм технологическом процессе и таком же количестве транзисторов,
а главное в результате всего этого количество годных кристаллов
на выходе существенно увеличивается". Остается принять все
это на веру и успокаивать себя мыслью о том, что 3dfx знает, что
делает.
Интересно, а почему
в VSA-100 используется 14 млн. транзисторов? Чип Savage4000 от S3
содержит 12 млн. транзисторов. При этом Savage4000, как и VSA-100
имеет два конвейера и по два текстурных блока на каждом. Однако
Savage4000 имеет интегрированный геометрический сопроцессор, а в
VSA-100 его нет. Или есть, но нам об этом не говорят? Представляете
ситуацию, когда в марте 2004 года 3dfx вдруг заявит, что VSA-100
имеет геометрический сопроцессор, просто раньше об этом молчали
из-за недоработок в программном обеспечении. Но это все мечты, не
имеющие ничего в основе.
Отметим, что в дизайне
чипа VSA-100 использовались разработки, которые применялись во всех
предыдущих сериях графических процессоров от 3dfx, что должно обеспечить
полную совместимость со всеми существующими приложениями, оптимизированными
под них. Хотя, все это, на мой взгляд, не гарантирует нас от ситуации,
когда придется вновь ждать патчи для игр, рассчитанных под предыдущие
версии Glide, чтобы насладиться старыми играми на новой графической
карте.
Один важный момент
пока не имеет четкого объяснения. Это ширина полосы пропускания
локальной видеопамяти и интерфейс памяти. Дело в том, что чип VSA-100
обеспечивает довольно высокие показатели fillrate, а если на карте
установлено 2 или более чипов VSA-100, то величина fillrate возрастает
еще больше. При этом, с ростом fillrate возрастает нагрузка на шину
памяти. Если пропускной способности шины локальной видеопамяти будет
недостаточно, то потенциальный fillrate так и останется потенциальным.
Память может просто не успеть передать необходимое количество данных,
следствием чего станет падение производительности, а пользователь
не получит в высоких разрешениях ожидаемых значений fps. Особую
критичность вопрос о типе локальной видео памяти становится при
воспроизведении 3D графики при 32 битной глубине представления цвета,
тем более что этот режим поддерживается VSA-100. Тем не менее, использование
новой версии технологии SLI позволяет довольно изящным образом решить
проблему с нагрузкой на шину памяти. Шина памяти разгружается за
счет того, что каждый чип VSA-100 формирует лишь часть строк, из
которых состоит полный кадр. В результате каждому чипу VSA-100 вполне
достаточно иметь 128 битную шину памяти.
Кроме того, пока нет
никакой ясности с поддержкой памяти типа DDR2/3. На наш взгляд ничто
не мешает реализации такой поддержки, например, с прицелом на будущее.
К тому же никак нельзя назвать низкой объявленную цену карт на базе
VSA-100, особенно учитывая, что карты должны попасть на рынок лишь
в первом квартале 2004 года. Зато если за объявленную цену будут
предложены платы с локальной видеопамятью типа DDR SGRAM на борту,
привлекательность новых продуктов от 3dfx существенно возрастет.
С другой стороны, 3dfx может просто снизить цену, не прибегая к
изменению параметров своих карт.
Отметим, что частота
шины памяти вновь будет синхронизирована с частотой графического
ядра, как это было у продуктов серии Voodoo3.
Как и ожидалось, чип
VSA-100 поддерживает воспроизведение 3D графики при 32-битной глубине
представления цвета и при 24 битной Z-буферизации и при использовании
8 битного стенсель буфера. Та функциональная возможность, за отсутствие
которой так ругали 3dfx в последний год, наконец, поддерживается.
Открытым остается вопрос о том, каким будет качество 3D графике
при 32 битной глубине представления цвета, т.к. это первый опыт
3dfx. В принципе, поддержка таких функция как однопроходная трилинейная
фильтрация, режимы смешивания цветов с использование альфа канала,
рельефное текстурирование и мультитекстурирование способствует обеспечению
очень высокого качества графических моделей. Будем надеяться, что
качество нас действительно не разочарует.
К слову, когда речь
идет о работе с 32 битной глубиной представления цвета, сразу встает
вопрос о том, как сильно пострадает от этого производительность
видеоподсистемы. 3dfx обещает, что при работе с 32 битным цветом
пользователь все равно сможет играть при средних значениях fps соответствующих
60 кадрам в секунду. Чего, по мнению 3dfx, более чем достаточно
для комфортной игры. При этом уже не важно, какая величина fps при
том же разрешении и в том же приложении достигается при 16 битной
глубине цвета. В принципе все логично. Если вас устраивает скорость
и качество, то и проблемы нет. Посмотрим, как все будет обстоять
на самом деле.
Отметим, что VSA-100
поддерживает 32 битные текстуры с разрешением до 2040х2048 пикселей
и AGP текстурирование. Это тоже две функциональные особенности,
поддержку которых так долго ждали от 3dfx. Остается проверить на
практике, как все это будет работать.
Чип VSA-100 поддерживает
две технологии компрессии текстур DXTC и FXT1. Первая технология
является вариантом S3TC, лицензированным Microsoft и включенным
в состав DirectX, вторая технология разработана самой компанией
3dfx и является полностью открытой. Интересно, что, так как FXT1
поддерживается чипом VSA-100, это гарантирует, что и DXTC также
будет поддерживаться аппаратно. Дело в том, что для DXTC используется
один алгоритм компрессии, а для FXT1 четыре алгоритма. FXT1 поддерживается
на аппаратном уровне и было бы логично встроить аппаратную поддержку
алгоритма DXTC, тем более, что общая привлекательность продукта
от этого только выигрывает. Остается надеется, что все так и обстоит
на самом деле.
Совершенно неясно
обстоит дело с тем, какой именно методы или методы рельефного текстурирования
поддерживаются чипом VSA-100, можно только предположить, что наверняка
поддерживаются методы Embossing и Dot Product. Опять же ждем разъяснений
от 3dfx.
Отдельно стоит упомянуть
поддержку декодирования MPEG2 видео. К сожалению, тут нет ничего
хорошего. Есть аппаратная поддержка преобразования данных из планарного
вида в упакованный. Все. Больше ничего не заявлено. Нет ни слова
об оверлеях и о компенсации движения. Остается надеется, что хотя
бы оверлеи поддерживаются в необходимом объеме.
Карты на базе чипа
VSA-100
Компания 3dfx решила
более четко разделить решения для массового рынка и профессионального
рынка. Для массового рынка 3dfx предполагает выпустить целую серию
карт, использующих чип VSA-100:
VoodooX 6500
AGP:
- Один чип VSA-100
- RAM 128 Mb
- Fillrate 333-367 млн. пикселей
в секунду включая режим мультитекстурирования
- Поддержки T-Buffer нет со
всеми вытекающими (нет FSAA и спец. эффектов)
- Ориентировочная цена $179
По сути, VoodooX (на
картинке выше она самая верхняя) это карта серии Voodoo5, но с поддержкой
AGP текстурирования, больших текстур, 32 битной глубины представления
цвета в 3D графике и 24 битной Z-буферизацией и 8 битного буфера
шаблонов. Если бы эта карта появилась на рынке весной 1999 года
или хотя бы осенью 1999 ее перспективы были бы вполне ясны. По крайней
мере, она бы конкурировала с платами на базе чипов NVIDIA FX и ATI
R400 Max. Продажи ее были бы очень успешными, и свое положение на
рынке 3dfx как минимум не потеряла бы. Но карты VoodooX должны попасть
на рынок лишь в первом квартале 2000 года и единственным их неоспоримым
преимуществам над конкурентами, присутствующими на рынке уже почти
год, является лишь native поддержка API Glide. На мой взгляд, карты
Voodoo4 просто опоздали на рынок. Кто будет покупать эти карты при
цене в $179 мне не понятно. Если цена будет менее $100, то свою
нишу эта карта захватит.
VoodooX 7000
AGP:
- Два чипа VSA-100
- RAM 256 Mb
- Fillrate 667-733 млн. пикселей
в секунду включая режим мультитекстурирования
- Поддержки T-Buffer есть, т.е.
есть аппаратный FSAA и спец. эффекты
- Ориентировочная цена $229
Если не будет PCI-X
варианта, то, на мой взгляд, ее ниша на рынке будет очень ограниченная.
К тому же цена выглядит несколько завышенная. При такой стоимости
карта будет конкурировать с продуктами в ценовой категории до $200,
и вряд ли кто-то захочет переплачивать за аппаратную поддержку FSAA
и специальных эффектов при прочих равных функциональных возможностях
и параметрах. Никто не захочет переплачивать за VoodooX 5000, если
подтвердится гипотеза о том, что использование T-Buffer (использование
в частности использование FSAA) существенно повлияет на общую производительность
данной карты. С другой стороны, если в разрешения вплоть до 1024х768
при 32 битной глубине представления цвета пользователь при использовании
T-Buffer получит среднюю величину 60 fps в своих любимых приложениях,
то привлекательность карты сразу существенно возрастет. Большинство
пользователей все равно играют в разрешениях вплоть до 1024х768,
так что остается лишь проверить все гипотезы на практике и принять
самостоятельное решение.
VoodooX 7500
AGP:
- Два чипа VSA-100
- RAM 256 Mb
- Fillrate 667-733 млн. пикселей
в секунду включая режим мультитекстурирования
- Поддержки T-Buffer есть, т.е.
есть аппаратный FSAA и спец. эффекты
- Ориентировочная цена $299
Это модернизированный
вариант карты VoodooX 5000, добавили памяти 32 Мб, задействовали
AGP интерфейс и подняли цену на $70. Если для нормальной работы
карты в AGP варианте требуется, чтобы для каждого чипа VSA-100 было
установлено по 32 Мб памяти, то тогда непонятно, почему в PCI версии
обошлись лишь по 16 Мб локальной видео памяти. Обратите внимание
на фотографию карты Voodoo5 5500, видите в верхнем правом углу разъем
белого цвета? Это стандартный разъем для электропитания внутренних
периферийных устройств компьютера. Нечто похожее мы уже видели у
карты Canopus Spectra 7400 на базе GPU GeForce 256. В принципе,
ничего удивительного в таком решении 3dfx нет. Два графических чипа
VSA-100 потребляют около 25 Ватт в сумме. Использование питания
напрямую от блока питания должно обеспечить надежное снабжение энергией,
а значит и стабильную работу карты VoodooX 5500. Скорее всего, именно
эта плата будет пользоваться наибольшим спросом среди желающих получить
в играх эффект FSAA и другие специальные эффекты, обеспечиваемые
T-Buffer. Если 3dfx снизит цену карту, то успех у нее на рынке определенно
будет.
VoodooX 8000
AGP:
- Четыре чипа VSA-100
- RAM 512 Mb
- Fillrate 1.32 - 1.47 млн.
пикселей в секунду включая режим мультитекстурирования
- Поддержки T-Buffer есть, т.е.
есть аппаратный FSAA и спец. эффекты
- Ориентировочная цена $599
Самая мощная из объявленных
карт. Имеет четыре чипа VSA-100, 128 Мб локальной видеопамяти и
невероятно высокую стоимость. Судя по всему, только карта VoodooX
6000 сможет в полной мере продемонстрировать все прелести аппаратной
реализации FSAA без существенного ущерба общей производительности
видеоподсистемы. Прежде всего, это станет возможно из-за использования
четырех чипов VSA-100 в режиме SLI. Скорее всего, ощутить разницу
между Voodoo5 5500 и VoodooX 6000 можно будет только в высоких разрешениях,
например, 3dfx обещает, что можно будет играть в разрешении 1600х1200
при 32 битной глубине представления цвета при 60 fps с использованием
всех эффектов T-Buffer, включая аппаратный FSAA. Большие объемы
локальной видеопамяти объясняются тем, что память распределяется
между четырьмя чипами VSA-100, и не является общей. Наличие же 32
Мб доступной памяти под буферизацию и текстуры для каждого графического
процессора вполне достаточно для нормального функционирования. Тем
не менее, за такие немалые деньги нам предлагается карта с невероятными
показателями fillrate. Фактически, если не случится чуда в виде
релиза от какой-либо темной лошадки вроде BitBoys, то плата VoodooX
6000 AGP станет первым акселератором с возможностью вывода более
1 Гигапикселя в секунду на экран монитора, рассчитанной на массовый
рынок. Посмотрим, как все это будет выглядеть на практике.
К слову, на фотографии
карты VoodooX 6000 AGP отчетливо виден чип с маркировкой Intel.
Судя по всему это Non-transparent PCI-to-PCI bridge. Зачем нужен
этот непрозрачный мост на видеокарте? Если посмотреть на описание
Non-transparent PCI-to-PCI bridge, то мы узнаем, что этот мост позволяет
представить некую подсистему в качестве одного единственного устройства
для CPU компьютера. При этом непрозрачный мост еще и скрывает все
ресурсы подсистемы от CPU. В результате за непрозрачным мостом можно
расположить очень мощную графическую подсистему, состоящую из нескольких
работающих параллельно чипов. Означает ли использование этого моста,
что карта Voodoo5 6000 не будет поддерживать AGP текстурирование?
Вряд ли. Мне кажется, что данный непрозрачный мост применяется только
для представления карты, представляющей собой целую графическую
подсистему, в виде одного устройства. Было бы совершенно нелогично
отказываться от использования всех возможностей AGP лишь для того,
чтобы позволить работать параллельно четырем чипа VSA-100. В любом
случае, будем ждать разъяснений от 3dfx.
Замечу, что есть неподтвержденная
информация о том, что микросхема от Intel это ни что иное, как процессор
i960, который в силу своей универсальности, может выполнять роль,
как AGP-to-AGP bridge, так и выступать в какой-либо другой специфичной
роли.
На картах серии VoodooX
5000 не применяется аналогичный мост (по крайней мере, его не видно
на иллюстрациях) видимо из-за того, что при использовании лишь двух
чипов VSA-100 нет проблем с взаимодействием графической подсистемы
с CPU. При этом разделить доступ к AGP памяти можно чисто программными
методами, т.е. через драйвер. По крайней мере, ATI в своей технологии
MAXX использует именно программный метод разделения доступа к AGP
памяти двух графических чипов, установленных на одной карте и никаких
мостов ATI не использует.
Теперь уместно перейти
к вопросу с электропитанием. Если картам серии VoodooX 5000 с двумя
чипами VSA-100 потребовалось дополнительное питание, то, как обстоит
дело у карты с четырьмя чипами VSA-100? Каждый чип VSA-100 потребляет
от 12 до 13 Ватт электроэнергии, что примерно на 30% больше, чем
потреблял чип Voodoo5. На карте VoodooX 6000 расположено сразу четыре
чипа VSA-100, а, кроме того, еще и 128 Мб локальной видеопамяти
и дополнительный мост от Intel. В итоге 3dfx решила применить очень
оригинальное решение проблемы с электропитанием. Карта Voodoo5 6000
будет иметь собственный источник электропитания под названием "Voodoo
Volts" и мощностью 100 Вт. Причем это действительно отдельный
источник питания, который будет подключаться непосредственно к стандартной
розетке 220 или 110 Вольт, и обеспечивать работоспособность карты
VoodooX 6000. По внешнему виду этот источник питания очень похож
на те, которые используются с ноутбуками. К карте VoodooX 6000 внешний
источник питания будет подключаться через разъем рядом с VGA выходом
платы. Такое решение обеспечит надежную работу карты и гарантирует
работоспособность в любом компьютере.
Несмотря на огромную
мощность карты и внешний источник питания цена в $599 выглядит завышенной.
Если 3dfx снизит цену хотя бы до $499, то перспективы продать некоторое
количество таких карт для hardcore gamers, вполне реальны.
Для профессионального
применения 3dfx рекомендует использовать решения от Quantum3D под
общим названием AAlchemy. AAlchemy это новое семейство мощных систем
3D графического моделирования в реальном времени. Каждая графическая
подсистема AAlchemy состоит из одного, двух или четырех карт, на
каждой из которых установлено 4 или 8 чипов VSA-100 и по 32 или
64 Мб локальной видеопамяти для каждого чипа. Графическая система
AAlchemy потенциально может обеспечить величину fillrate более 3
Гигапикселей в секунду! Графические подсистемы AAlchemy рассчитаны
на использование в системах серии Heavy Metal. Правда и стоимость
таких систем измеряется четырех и пятизначными суммами в долларах.
Выводы
Итак, попробуем подвести
черту. Компания 3dfx анонсировала не просто новый графический чип
VSA-100, она анонсировала новую идеологию создания высокопроизводительных
графических решений. Сама по себе идея параллельной обработки данных
очень интересна и перспективная. Пока сложно прогнозировать, как
отнесется рынок к новым решениям от 3dfx. Особенно в свете того,
что есть ряд неясный моментов и вопросов. Не вызывает споров только
одно: пока мы не увидим все обещанное в действие делать какие-либо
выводы преждевременно.
Фактически в первом
квартале 2004 года пользователям придется сделать выбор между T-Buffer
(включая эффект FSAA) и аппаратным расчетом T&L. Очень сильно
на принятие решения повлияет ситуация с поддержкой в приложениях
геометрических сопроцессоров. При этом нужно понимать один нюанс.
Недостаточно простого заявления о том, что такая-то игра рассчитана
на аппаратную реализацию вычислений T&L. Только в том случае,
если эта игра при использовании графической карты с геометрическим
сопроцессором будет выглядеть на экране монитора пользователя однозначно
лучше, чем при использовании карт серии Voodoo5, пользователь выберет
продукты конкурентов, а не 3dfx. Если окажется, что большинство
игр с заявленной поддержкой аппаратного расчета T&L не используют
в полной мере этих аппаратных возможностей графических карт, читай,
используют в сцене точно такое же количество полигонов, как при
запуске на системе без поддержки геометрического сопроцессора, тогда
никакого смысла покупать карты с геометрическими сопроцессорами
не будет. Действительно, зачем покупать карту с геометрическим сопроцессором,
если уже осенью 2004 года нам предложат новое поколение подобных
карт. В таком случае на передний план действительно выйдут карты
серии Voodoo5, так как они предлагают пользователю возможности,
который он сможет использовать немедленно, причем как в новых, так
и в старых играх. Речь идет о T-Buffer, точнее о главном его эффекте
- full scene anti-aliasing (FSAA). При этом одним эффектом FSAA
все не исчерпывается. T-Buffer позволяет также на аппаратном уровне
реализовать массу специальных эффектов, которые широко используются
в киноиндустрии. Применение этих эффектов требует поддержки в интерфейсах,
в то время как аппаратная реализация FSAA совершенно прозрачна для
приложений и API. В общем, нас ждет интересное время, когда придется
делать выбор и расплачиваться за него из собственного кармана.
К слову, если бы 3dfx
анонсировала поддержку в своих новых продуктах аппаратного расчета
T&L ситуация с поддержкой геометрических сопроцессоров в приложениях
могла бы существенно изменится. Причем изменится ситуация могла
бы в сторону ускорения поддержки геометрических сопроцессоров. Пока
же остается надеяться на то, что у NVIDIA и S3 хватит сил и красноречия
убеждать разработчиков и издателей игр использовать возможности
некоторых новых акселераторов по аппаратному расчету T&L.
Что касается расплаты,
то еще раз подчеркну свою мысль о том, что пока заявленные цены
на карты VoodooX выглядят несколько завышенными, и немного пугают.
Пока нам остается
искать ответы на вопросы, копить деньги и ждать появления на рынке
первых реальных карт на базе VSA-100.
Использованы
материалы компании 3dfx и Thersh's FiringSquad
с 1 апреля Вас господа :)
|