Текстурные блоки g80
В G80 текстурные блоки всё ещё плотно привязаны к своим кластерам шейдерных процессоров. Это несколько снижает производительность, т.к. процессоры не могут использовать "чужие" текстурники, даже когда те свободны.
Каждый текстурный блок состоит из 4 блоков адресации, 8 (32 в терминологии R600) блоков выборки и 8 блоков фильтрации. Выборка из FP16 текстуры выполняется на половинной скорости, из FP32 текстуры - в четыре раза медленнее, чем выборка INT8. Блоки фильтрации способны аппаратно фильтровать любые форматы текстур. Некоторые примеры возможностей: каждый текстурный блок способен либо выполнить 4 билинейные AF 2x с форматом INT8 (да, бесплатная AF 2x, если нужные тексели оказались в L1 кеше), либо 4 билинейные фильтрации с форматом FP16, либо 2 билинейные фильтрации с форматом текстуры FP32. Текстурный блок может наложить до 128 текстур за проход.
Текстурные блоки имеют L1 кеши по 8 КБ каждый. L2 кеш, объём которого равен 128 КБ, текстурные блоки делят с блоками ROP. По всей видимости, текстурные блоки G80 используются для доступа к буферам констант шейдерными процессорами, что может негативно сказаться на производительности DirectX 10 приложений.
Текстурные блоки G80 также управляются арбитрами отдельно от шейдерных процессоров.
В чипах G84 и G92, появившихся после G80, каждый кластер шейдерных процессоров уже включает по 8 блоков адресации текстур.
- Краткий справочник терминов, упоминающихся в статье
- Текстурные блоки g80
- Заключение
- Краткий глоссарий некоторых терминов, использованных в статье
- Новая микроархитектура Graphics Core Next и видеокарта amd Radeon hd 7970
- Немного истории
- Общие сведения
- Архитектура унифицированных шейдерных процессоров
- Понятие vliw-архитектуры
- Понятие программных нитей и wavefront
- Новая архитектура Graphics Core Next
- Блок Compute Unit
- Графический процессор с архитектурой Graphics Cores Next
- Графический процессор amd Radeon hd 7970