uzluga.ru
добавить свой файл
О принципиальном отличии мультиклеточной архитектуры от потоковых машин, EDGE, CISC, RISC, VLIW – архитектур и их модификаций


Когда мы говорим о мультиклеточной архитектуре, мы позиционируем ее как принципиально новое направление в создании процессорных устройств. Но, наши оппоненты говорят, что это либо еще одна реализация DF, либо EDGE-архитектура, что-нибудь многоядерное и тому подобное. Попробуем ответить на вопрос – «в чем принципиальная новизна мультиклеточной архитектуры, и чем она отличается от уже известных?»

Как известно, функционирование любого процессора – это выполнение некоторой информационно связанной последовательности команд. В свою очередь, информационная связность предполагает наличие команд–источников результатов и наличие команд–приемников этих результатов.

Существует два возможных типа связи – опосредованная (косвенная) и непосредственная.

В случае опосредованной связи для передачи информации (результата) между источником и приемником используется запоминающая среда (регистры, память). Результат запоминается и только после этого он становится доступен другим командам, но уже как значение некоторого элемента запоминающей среды. При этом, естественно, результат отчуждается, т.е. теряется связь с командой – источником. Опосредованная связь используется в фон-неймановских процессорах и ключевой принцип построения данных процессоров, а именно принцип последовательного программного управления, при котором решение процессором некоторой задачи достигается пошаговым целенаправленным изменением его состояния – прямое следствие использования этого вида связи. Этот процесс изменения состояний является результатом исполнения последовательности команд строго в заданном порядке. Порядок исполнения задается программистом в процессе программирования и может быть реализован либо принудительным, либо естественным способом выборки команд на исполнение.

Принудительный способ выборки не налагает каких-либо ограничений на размещение команд в памяти, но требует, чтобы в каждом командном слове было выделено поле, в котором должен быть записан адрес следующей исполняемой команды. В настоящее время он практически не используется.

Естественный способ выборки – диаметрально противоположное решение. При этом способе команды размещаются в памяти последовательно, одна за другой в том порядке, в котором планируется их исполнение. Поле с адресом следующей исполняемой команды используется только в командах передачи управления, когда необходимо перейти после завершения исполнения одной выполняемой последовательности команд к другой.

Существует достаточно много вариантов реализации фон-неймановской модели. Как правило, все они направлены на решение одной и той же задачи, а именно, на повышение производительности процессора, но решают они ее разными методами.

Например: конвейерные процессоры за счет совмещения выполнения потока команд во времени при использовании одного исполнительного устройства; RISC процессоры – сокращая объем реализуемых операций и, следовательно, время выполнения одной команды; CISC процессоры – увеличивая объем операций выполняемых одной командой и, соответственно, время, но при этом уменьшая общее количество выполняемых команд.

За счет совмещения выполнения команд в пространстве, т.е. на нескольких исполнительных устройствах, обеспечивают повышение производительности суперскалярные, многоядерные и VLIW процессоры. При этом в суперскалярных процессорах задача распределения потока команд по исполнительным устройствам решается преимущественно аппаратным способом, а в многоядерных и VLIW процессорах – программным.

В конкретных реализациях эти и другие методы могут сочетаться. RISC и CISC процессоры обычно имеют конвейерную организацию, но отличаются длиной конвейера. Конвейер также широко используется для сокращения времени выполнения потока команд поступающего к исполнительному устройству в суперскалярных процессорах. Наиболее совершенные способы организации конвейера не только реализуют совмещение выполнения потока команд во времени, но и обеспечивают переупорядочивание команд в конвейере для устранения конфликтов по данным между ступенями конвейера. В этом случае команда в конвейере выдается на исполнение не по очереди, а по готовности. Наиболее известны две схемы, реализующие такое переупорядочивание команд. Это схема централизованного окна команд и распределенная схема Томасуло.

Сочетанием методов отличается и проект TRIPS, архитектуру которого авторы относят к EDGE-архитектуре – явного исполнения графа потока данных. Кристалл имеет два функциональных блока, каждый из которых является фактически VLIW процессором содержащим 16 (4х4) 64-разрядных АЛУ с плавающей точкой, которые работают как DF машина. От традиционной DF машины они отличаются тем, что команды загружаются во все АЛУ одновременно, но процесс их выполнения как в DF машине – асинхронный, по готовности операндов.

Следует отметить, что как использование методов распараллеливания в суперскалярных или в VLIW процессорах, так и методов переупорядочивания команд в конвейере, которые меняют очередность исполнения команд, или методов исполнения команд «по готовности» – не отменяет ключевого принципа фон-неймановской модели – упорядоченного изменения состояния процессора. Вне зависимости от очередности исполнения команд, формируемые ими состояния процессора, реализуются в той последовательности, в которой эти команды были размещены в памяти, а не исполнены. Этот принцип ограничивает возможности указанных методов и увеличивает аппаратные затраты на их реализацию, а также требует решения сложной задачи распараллеливания при использовании более чем одного процессора для выполнения программы.

Непосредственная информационная связь предполагает, что результат поступает командам – приемникам и после приема он становится частью этих команд. Т.о. результат существует только в момент передачи и после передачи он исчезает.

Возможны всего два способа реализации непосредственной информационной связи – адресная рассылка и широковещательная рассылка.

При адресной рассылке результат передается конкретной команде – приемнику. Инициатором передачи является команда – источник результата.

При широковещательной рассылке все результаты передаются всем. Для выбора требуемых результаты при этом именуются, т.е. каждому результату дается индивидуальное имя, которое однозначно привязывает его к команде – источнику. Команда – приемник осуществляет отбор требуемых ей результатов по имени из общего потока результатов.

Использование адресной рассылки – ключевой принцип построения DF процессоров. Каждое командное слово такого процессора, как правило, содержит код операции, поля операндов, адрес командного слова, которому передается результат выполненной операции, и номер операнда, в поле которого будет размещено полученное значение. В результате, последовательность команд в программе неупорядочена и в принципе может быть размещена в памяти программ произвольным образом. Команда выбирается и выполняется «по готовности операндов», т.е. тогда, когда ею получены все результаты выполнения других команд, необходимые для выполнения данной команды. Принцип исполнения команд потокового процессора «по готовности операндов» позволяет реализовать параллелизм «естественным» образом – без решения задачи распараллеливания, но требует для этого использования специальных языков программирования (языков с однократным присваиванием).

Редукционная модель процессора также использует адресную рассылку, но она задается в командном слове указанием адреса команды, результат выполнения которой используется данной командой в качестве операнда. В этом случае команды выбираются из памяти и исполняются «по запросу команды» Такая модель тоже позволяет отказаться от упорядоченности команд и, следовательно, они могут быть размещены в памяти произвольным образом. Как и потоковая, редукционная модель также обеспечивает «естественную» реализацию параллелизма, но при этом также требует использования для написания программ специальных языков, а именно языков функционального программирования.

Все потенциальные достоинства DF (потоковых) и редукционных процессоров связаны с использованием непосредственных информационных связей, а все их недостатки изначально предопределены использованием адресной рассылки. Многочисленные попытки модифицировать адресную рассылку не изменяли суть данного метода (например, ввод тегов – это виртуальное расширение адреса («адрес» & «тег»), а не смена парадигмы), но свидетельствовали о весомости потенциальных преимуществ. Тем не менее, как первые, так и вторые практически остались на уровне исследовательских проектов.

Принципиальной основой мультиклеточной архитектуры является широковещательная рассылка. Реализация непосредственных информационных связей с использованием данной рассылки позволяет сохранить все те преимущества, которые связаны с непосредственными связями, и устранить все те недостатки, которые присущи адресной рассылке. Более того, появляются новые возможности, недостижимые как для фон-неймановской модели, так и для DF процессоров (см. также материалы сайта www.multiclet.com).