Doku. Hilfs-FPGA - 2.3.4 A guide to Carsten's VHDL

2.3.4 "A guide to Carsten's VHDL"

Um das Lesen und Verstehen der vom Autor verfaßten VHDL-Quellen zu erleichtern, hat dieser versucht, den üblichen Aufbau einer VHDL-Beschreibung beizubehalten. Nach einem Kopf mit Kommentaren und Angaben zur Code-Version folgt deshalb die entity-Deklaration (Ein- und Ausgänge der beschriebenen Einheit), wiederum gefolgt vom großen Block der architecture-Definition.

Diese enthält im Top Level-Design ctrl_pur die Deklarationen der Komponenten "PC-Interface" und "Display-Ansteuerung" (Ein- und Ausgänge). Nur lokal verwendete Signale müssen anschließend deklariert werden. Für die state machines ist dabei auch die Deklaration eines Typen notwendig (Aufzählungstyp, der die Bezeichnungen der Automaten-Zustände enthält). Auf diesen folgt stets die Deklaration aller Signale dieses Typs.

Nach einem BEGIN werden gegebenenfalls Komponenten instanziiert (und angeschlossen), danach folgt bis zum Dateiende die eigentliche Verhaltensbeschreibung, gegliedert in konkurrente Prozesse und (bedingte) konkurrente Signalzuweisungen.

Die Beschreibungen von Automaten finden sich stets am Ende, und zwar in jeweils zwei Prozessen. Der erste beschreibt mit einer einzigen CASE-Anweisung eine Logik, die laufend aus dem gegenwärtigen Zustand (c_state, c_state2, c_rasta) und eventuell zusätzlichen Signalen den Folgezustand ermittelt (m_state, m_state2, m_rasta). Der zweite Prozeß, welcher stets ein "SYNCH" im Namen trägt, führt getaktet die Anweisung c_state m_state (oder entsprechend) aus. Dieser Prozeß folgt dem gleichen Aufbau, wie die Prozesse für weitere speichernde Elemente: In einer IF-Anweisung wird erst asynchron auf einen Reset und dann auf die relevante Clockflanke abgefragt, die gegebenenfalls den Wert eines Registers ändert; im einfachsten Falle müßte es für einen Automaten also heißen:

SYNCH_NUR_EIN_BEISPIEL: process(clk, reset, m_state)

begin

if (reset = '0') then

c_state initialzustand;

elsif (clk'event and clk='1') then -- Vorderflanke

c_state m_state; -- Zustandswechsel

end if;

end process;

Wenn in einer konkurrenten Zuweisung der Form

signal signal_ff when <Bedingung> else <Wert>;

ein Signal aus einem Puffer abgeleitet wird, folgt direkt darauf der Prozeß, der den Wert dieses Puffers bestimmt.

2.3.5 Besondere Designentscheidungen im Detail

Warum statische RAM-Bausteine (SRAMs)?

Als Technik für den Speicher mit wahlfreiem Zugriff (random access memory, RAM) wurde die der statischen Informationsspeicherung gewählt (SRAM), im Gegensatz zu der im Massenmarkt dominierenden dynamischen Technik (DRAM). Warum dieses, obwohl SRAM-Bausteine deutlich teurer sind und ihr Geschwindigkeitsvorteil für das vorliegende Design von Anfang an keine Rolle spielte (ein Takt im einstelligen MHz-Bereich ist von beiden Techniken problemlos ohne Wartezyklen zu bewältigen)?

Der Grund ist die wesentlich einfachere Ansteuerung von SRAMs; diese besitzen keine nach außen hin sichtbare Zeilenstruktur und müssen, anders als DRAMs, auch nicht regelmäßig aufgefrischt werden, um ihren Inhalt nicht zu verlieren. Mit SRAMs konnte also das Ziel, überhaupt funktionsfähigen Speicher zu bauen, schneller erreicht werden; man bedenke hierbei, daß die an dem Projekt teilnehmenden Studenten größtenteils keinerlei Vorkenntnisse im Hardware-Entwurf besaßen noch eine Vielzahl anderer Aufgaben zu lösen hatten.

Kein Nachteil ist die geringere Kapazität des installierten SRAMs - 131072 Worte reichen für Assemblerprogramme vollkommen aus.

Taktung der Prozesse - Fehlervermeidung

Erst getaktete Schaltwerke sind mit vernünftigem Aufwand zu handhaben und erfüllen, falls eine Übertaktung ausgeschlossen wurde und, im Falle von Taktpegelsteuerung, eine Zweiflankensteuerung vorgesehen wurde, meist schnell ihre Spezifikation. Sobald ein Entwurf jedoch über einen endlichen Automaten mit Logik, die dessen Zustände abfragt, hinausgeht, kommt ein neues Feld von Fehlern hinzu.

Betrachten wir hierzu zunächst den einfachsten möglichen Fall: Ein triviales Schaltwerk invertiert mit jedem Takt sein einziges Zustandsflipflop A. Ein Flipflop B soll den Zustand des Schaltwerkes speichern. In diesem Fall ist es noch sicher, beide Flipflops auf dieselbe Taktflanke reagieren zu lassen. Günstigenfalls erreicht die Flanke beide Zeitglieder praktisch gleichzeitig, woraufhin A seinen neuen Wert annimmt und B den alten Wert speichert; B enthält also den im vorherigen Takt aktuellen Wert von A. Daß B sicher den alten und nicht den neuen Wert, oder gar den Übergang zwischen beiden, sieht, liegt am sogenannten propagation delay, also der Zeit, die zwischen Eintreffen der Taktflanke am Takteingang und Erscheinen des neuen Wertes am Ausgang eines Flipflops vergeht; dieses muß größer sein, als der Versatz der Clockflanken an A und B zuzüglich der Haltezeit von B.

Sei nun das Schaltwerk weniger trivial, A und B mithin Bit-Vektoren. Dadurch steigt die Wahrscheinlichkeit, daß die Taktflanke ein Flipflop aus B erst erreicht, wenn schon eines aus A den neuen Wert am Ausgang zeigt; B würde dann einen beliebig falschen Wert enthalten (Zustandscodes, die nur um ein Bit differieren, müssen nicht "verwandte" Zustände bezeichnen). Die Wahrscheinlichkeit wird nochmals erhöht, wenn die Clock sich auf den gleichen Bahnen auf dem FPGA fortpflanzt, wie andere logische Signale auch und eventuell noch aus Logik entsteht (Ableiten der inversen Clock aus der normalen) - die geringe maximale Taktfrequenz (siehe 2.3.5.3) deutet auf relativ große Verzögerungszeiten hin. Weil die Verhaltensbeschreibung in VHDL die Zuordnung der Logik zu den Logikzellen des FPGAs offenläßt, was aus Gründen der Übersichtlichkeit und Handhabbarkeit auch erwünscht ist, können Fehler durch Taktimpulsverschiebungen mit jeder Version eines Designs in der Stärke variieren.

Auf dem Hilfs-FPGA werden Fehler durch kritische Taktimpulsverschiebungen auf zweierlei Arten ausgeschlossen:

Benutzung der globalen Clocknetze der FLEX-Bausteine
Die Altera FLEX8000-Bausteine stellen zwei Eingänge zur Verfügung, auf denen Signale eingespeist werden können, die mit sehr geringer Verzögerung auf dem gesamten FPGA zur Verfügung stehen. Diese werden für clk und clk_invers benutzt, wobei clk_invers also extern aus clk erzeugt werden muß.

Benutzung unabhängiger Taktflanken
Der Autor hat sich bemüht, konsequent ein gewisses Schema der Taktung zu befolgen; scheinbare Ausnahmen sind entweder wohl begründet oder prinzipiell in der Sicherheit nicht zu verbessern (weil z.B. nicht bekannt sein kann, welche Taktflanke der Mikroprozessor für die Erzeugung eines bestimmten Signals verwendet). Das Schema lautet:

Automaten laufen mit der Vorderflanke.
Alle speichernden Elemente, die Automaten abfragen, laufen mit der Rückflanke.
Der Automat zur RAM-Ansteuerung ist ein solches Element.
Fragen Automaten einander ab, geschieht dieses durch mit der Rückflanke getaktete Pufferregister.

Man beachte, daß 1. die Problematik der gegeneinander verschobenen Taktflanken bereits entschärft, es aber trotzdem gute Gründe für die gleichzeitige Einhaltung von 2. gibt. Hierzu gehören die Klarheit des Timings, die Irrtümer des Entwerfers seltener macht (Vor- und Nachzeitigkeit sind nach Ansicht des Autors klarer zu erkennen) ebenso wie die Notwendigkeit, gewisse Wartezeiten einzuhalten (beim RAM-Zugriff etc.). Durch die Benutzung beider Taktflanken kann in einem Automaten immer, z.B. mit der Vorderflanke, ein Signal angefordert werden, welches rechtzeitig vor der Rückflanke anliegt und gespeichert wird. Der nächste Automatenzustand kann dann bereits eine andere Aufgabe erfüllen und muß kein Wartezustand sein, was die Automatengröße reduziert.

Ein Beispiel für eine "wohl begründete" Ausnahme wäre: In ctrl_pur.vhd ändert das Register user_char seinen Inhalt mit der Vorderflanke, obwohl es in display.vhd vom ersten, ebenfalls mit der Vorderflanke betriebenen, Automaten benutzt wird.

Dies ist ungefährlich, denn die Gefahr unerwünschten Verhaltens bestünde nur dann, wenn jemand user_char in dem Takt überschriebe, in dem sein Inhalt (im Zustand user_disp) angezeigt wird. Es wäre aber unklug, ein neues Zeichen in user_char abzulegen, ohne sich vergewissert zu haben, daß das alte schon angezeigt wurde, der erste Automat user_disp mithin schon hinter sich hat.

Dies ist sogar wünschenswert, denn user_char puffert den Datenbus, der sich - vom Mikroprozessor getrieben - mit unbekannter Taktflanke oder - vom Hilfs-FPGA getrieben - mit der Rückflanke ändert, weshalb eine Taktung mit der Vorderflanke also erstrebenswerter ist.

Momentane und maximale Taktfrequenz

Das Hilfs-FPGA wird momentan mit 1 MHz getaktet (aus dem Quarzoszillator IC18). Der kritische Pfad, also die zeitintensivste Aneinanderreihung von Gattern und Flipflops, die innerhalb eines Taktes ein Ergebnis liefern muß, hat eine Länge, die eine maximale Taktfrequenz von ca. 6 MHz bei Einflankenbetrieb erlaubt, d.h. 3 MHz bei Nutzung beider Taktflanken.

Die Design-Annahme eines Taktes von (höchstens) 1 MHz wurde an einigen Stellen ausgenutzt, die bei Erhöhung des Taktes zu ändern wären:

Um das FPGA, welches den Mikroprozessor beherbergen soll, zu konfigurieren, muß progr_m_config für mindestens 5 s auf '0' gezogen werden und anschließend für weitere 5 s '1' gewesen sein, bevor Konfigurationsdaten eintreffen. Um diese Zeiten einzuhalten wird counter in pc_if.vhd jeweils bis acht hochgezählt.
Die verwendeten SRAM-Bausteine mit einer minimalen Zyklusdauer von 20 ns für das SRAM respektive 15 ns für das Mikrocode-RAM lassen sich mit der FLEX-FPGA-Technik in dieser Hinsicht nicht jenseits ihrer Spezifikation betreiben.
Bei 1 MHz Takt ist der Takt für das Display - disp_e - für 500 ns aktiv; gefordert sind minimal 450 ns.
Ein neuer Befehl wird an das 20x2-Zeichen-Display mittlerweile unabhängig von der Taktung erst dann geschickt, wenn dieses durch sein Busy Flag signalisiert, daß es den vorherigen Befehl vollständig ausgeführt hat. Das Busy Flag trifft dabei mit einer Verzögerung von rund 60 ns ein. Die Alternative zu dieser aufwendigen Abfrage wäre simples Warten für eine genügend lange Zeit. Eine solche verlangsamte Ansteuerung der Anzeige erfordert bei 1 MHz für einen sicheren Betrieb eine Division des Taktes durch Werte größer 500 (9 Bit-Zähler).

2.4 Sonstiges

Anmerkung zur Notation

In Anlehnung an eine früher am Arbeitsbereich TECH in Standardzellen-Technik gefertigte Familie von Prozessoren (Democom 1, 2 und 3) und eine vom Autor im Vorfeld des Hilfs-FPGA-Entwurfs verfaßte VHDL-Beschreibung eines Prozessors für das 81500er-FPGA (Democom '95), ist in den VHDL-Sourcen nahezu ausschließlich von einem "Democom" die Rede. Diese aus Platzgründen gewählte Bezeichnung meint den Mikroprozessor.

In dieser Dokumentation erlaubte sich der Autor bei der Nennung von Arrays ebenfalls aus Platzgründen statt der korrekten VHDL-Syntax

status_reg(1 downto 0)

häufig das aus PASCAL, aber auch AHDL, bekannte

status_reg[1..0].

Altera FLEX8000-Bausteinfamilie

Die FLEX8000-Bausteine von Altera gehören als Teil der FPGA-Familie zu den programmable logic devices, also zu ICs, die nicht in einer fernen Chip-Fabrik mit den Logikfunktionen ausgestattet werden, die sie ausführen sollen, sondern die vor Ort, in diesem Falle also direkt am Arbeitsbereich TECH, programmiert werden können. Damit eignen sie sich hervorragend für Versuchsaufbauten und Prototypen, deren Spezifikation noch im Fluß ist. Auch Fehler können ohne lange Umlaufzeiten schnell beseitigt werden und es ist durchaus ein Vorgehen nach "trial and error" möglich - keine elegante Methode, aber eine, die, im Einzelfall kritisch abgewogen, viel Zeit sparen kann.

Mit den "klassischen" FPGAs von Altera haben die FLEX-Bausteine folgendes gemein:

Relativ hohe Kosten, deswegen Eignung wirklich nur für den Prototypen, nicht die Serie.
Der interne Aufbau zergliedert sich in sogenannte Logikzellen oder -elemente und programmierbare Datenverbindungen zwischen diesen. Die einzelne Logikzelle enthält immer eine programmierbare boolesche Funktion mit vier bis acht Eingangsvariablen und ein Flipflop.
In Abhängigkeit von der jeweiligen Familie gibt es Leitungen, um Teile der Logik an benachbarte Zellen auszuleihen bzw. um Zwischenwerte sehr schnell an benachbarte Logikzellen weiterzugeben.
Im Vergleich mit üblichen Chips aus der Fabrik (Standardzell- oder gar full custom Entwurf) geringe Komplexität: 8 bis 48 Logikzellen in der Classic-Familie, 32 bis 256 bei MAX7000, bis 1500 bei FLEX8000.
Wiederverwendbarkeit - Altera Classic und MAX7000 sind einige 100 Mal programmierbar.

Die FLEX8000-Familie insbesondere hat folgende Eigenschaften:

Alles, was durch die Programmierung einstellbar ist, wird in SRAMs auf dem FPGA festgehalten. Vorteile: Der Chip ist ohne Abnutzungserscheinungen beliebig oft programmierbar und benötigt hierzu keine hohe Spannung, kann also direkt in einem Versuchsaufbau konfiguriert werden. Außerdem kann das IC mit einem gewöhnlichen CMOS-Prozeß hergestellt werden, was die Kosten senkt. Nachteil: Bei jedem Spannungsabfall verliert der Chip seine Programmierung.
Ein FLEX8000-FPGA kann entweder passiv konfiguriert werden, wobei ein anderer Baustein die Konfigurationsdaten bereitstellen und in das FPGA schreiben muß, oder aktiv bei einem Power-Up alle Adressen eines ROMs durchlaufen und sich von diesem die benötigten Daten selber holen. Konfigurationsdaten können bit-seriell oder byte-parallel vorliegen.
Die boolesche Funktion in jeder Logikzelle wird über ein kleines RAM von 16x1 Bit realisiert. Dabei adressieren die vier Eingangsvariablen ein Bit dieser sogenannten look-up table; jede Funktion mit vier Eingängen ist so darstellbar. Sind, z.B. bei einer Adreßdekodierung, mehr Eingangsvariablen vorhanden, können die Ausgänge benachbarter look-up tables mit UND verknüpft werden (in unter 1 ns). Genauso schnell kann bei Zählern und Addierern der Übertrag von Zelle zu Zelle gereicht werden.
Für die I/O-Elemente, von denen jeder Pin eines besitzt, heißt es: "Anders als in den Altera EPLDs sind die I/O-Blöcke nicht mehr einzelnen Logikzellen fest zugeordnet, sondern autonome Funktionseinheiten. Das globale Verbindungsnetzwerk erlaubt nun, Aus- und Eingänge jeder Logikzelle mit jedem beliebigen Pin zu verbinden. Jeder I/O-Block verfügt nunmehr über ein Flipflop, das als peripheres Register bezeichnet wird und z.B. für die Synchronisation asynchroner Eingangssignale benutzt werden kann. Desweiteren wurden im Vergleich zur MAX7000-Serie weitere Möglichkeiten zur Konfigurierung der I/O-Blöcke implementiert, z.B. optionale Invertierung und einstellbare Flankensteilheit für Ausgangssignale"

Für weitere Informationen und Details sei auf das Datenbuch der Altera-FPGAs verwiesen, sowie auf die Zusammenfassung "ALTERAs Feldprogrammierbare Logik-ICs. Kurzbeschreibung für das FPGA-Praktikum" von André Klindworth.

Die Problematik VHDL <-> AHDL

Altera propagiert für das Abfassen einer Verhaltens- und/oder Strukturbeschreibung von Hardware die Verwendung ihrer firmeneigenen Sprache AHDL (Altera Hardware Description Language), für die ihr Werkzeug Max+plus II ursprünglich ausschließlich ausgelegt war. Aufgrund des proprietären Charakters von AHDL bevorzugte der Autor jedoch den Quasi-Industriestandard VHDL (Very high speed integrated circuit Hardware Description Language). Diese sehr mächtige Sprache verfügt über den Vorzug einer verbindlichen Normung und erfreut sich großer, noch wachsender Akzeptanz und Verbreitung. Wegen der darin begründeten Marktbedeutung bekam auch Max+plus II eine VHDL-Schnittstelle eingebaut, die sich, wie viele Konvertierer, als steter Quell von Ungemach entpuppte.

Positiv ist noch zu beurteilen, daß Max+plus II bei der Detektion von fehlerhaftem bzw. verbesserungswürdigem Code sehr gründlich zu Werke geht und so ein "vhdlan -spc_elab" des Synopsys-VSS Simulators noch an "Ausbeute" übertrifft.

Negativ ist, daß Max+plus II (noch) nicht den vollen Sprachumfang von VHDL unterstützt. So ist es u.a. nicht möglich, mit dem Attribut vektor'range den Wertebereich eines Vektors zu ermitteln. Vektoren werden obendrein nur dann unterstützt, wenn ihre Elemente nicht mit mehr als nur einem Bit zu kodieren sind (was Vektoren von Elementen des Typs std_logic glücklicherweise noch nicht ausschließt, sehr wohl aber nicht-triviale Records, wie z.B. Mikrocodezeilen).

Wer über Fehlermeldungen des Typs "attribute not supported" bzw. "non locally static attribute not supported" rätselt, der hat vermutlich ein speicherndes Element von clk abhängig beschrieben, aber in der sensitivity list des Prozesses versehentlich clk_invers aufgeführt (oder natürlich umgekehrt).

Lediglich unschön ist es, daß explizit als Don't Care definierte Signale (mittels '-', z.B. e_rs_d "00";) immer als '0' angenommen werden; dies beschert dem Entwerfer eine Flut an Warnings und eventuell ein zu früh gefülltes FPGA. Desweiteren fehlt eine elegante Möglichkeit, auf die Zustandskodierung von endlichen Automaten Einfluß zu nehmen - nur die Auskodierung durch Verwendung von ebenso vielen Konstanten wie Automatenzuständen ist möglich.

Beliebte Fehler - Hinweise für zukünftige Entwürfe

Gerade bei Einsatz der SRAM-basierten FLEX8000-FPGAs scheint eine saubere Spannungsversorgung besonders wichtig zu sein. Spannungsschwankungen, die im FPGA zum teilweisen Löschen der Programmierdaten geführt haben können, blieben als einzige rationale Erklärung eines ansonsten unerklärlichen Verhaltens des Hilfs-FPGAs übrig. Dabei nahmen Zustandsflipflops der Automaten Wertekombinationen an, die sie nach der Hardwarebeschreibung nicht hätten erreichen dürfen. Das FPGA schien regelrecht „abzustürzen" und die Flipflops ignorierten sogar ihr Reset-Signal. Obendrein schien das Fehlverhalten von der jeweils geladenen Logik abhängig zu sein, verschwand aber bis zur Fertigstellung des MPB völlig.
Die Ansteuerung eines Displays, welches dem auf dem MPB verwendeten ähnelt, ist nicht trivial! Sie wird nicht einfacher durch die in verschiedenen Versionen vorliegende, für einige Display-Familien gültige technische Dokumentation. Diese ist eher als Nachschlagewerk parallel zu eigenen ständigen Versuchen zu verwenden.
Zwar ist die Anzeige ASCII-kompatibel und kann den Cursor auf Wunsch automatisch fortbewegen, so daß die Ansteuerungsarbeit grundsätzlich nur darin besteht, ein Zeichen anzulegen und ein Taktsignal zu erzeugen, doch das dabei zu beachtende Timing erwies sich als wesentlich komplizierter als vermutet.
Grundsätzlich wird empfohlen, das existierende display.vhd für weitere Anzeigen zu verwenden und ggf. zu modifizieren, da man ansonsten folgende Tatsachen erneut zu beachten hat:

Das Display nimmt Befehle zwar im 1 MHz-Takt entgegen, deren Bearbeitung allerdings wird, abhängig von dem anzuzeigenden (Steuer-)Zeichen, so lange dauern, daß eine Frequenzteilung durch ca. 500 oder die Abfrage des Busy Flag notwendig werden.
Das Busy Flag wird, nach 60 ns "Berechnungszeit", als Reaktion auf den Pegel von disp_e ausgegeben.
Vorher ist selbstverständlich disp_rw auf '1' zu ziehen, wobei eine Voreinstell-Zeit einzuhalten ist; eine Haltezeit ist ebenfalls notwendig.
Am ärgerlichsten war das zunächst unerklärliche Rollen des Bildschirminhaltes nach links, welches offenbar durch Hazards und/oder Haltezeitverletzungen auf disp_rs verursacht wird.
Die Wartezeit nach einem Reset sollte 40 ms nicht unterschreiten.

Alteras Entwurfssoftware Max+plus II enthält die Menüoption "Smart Recompile", die offenbar mit Vorsicht zu genießen ist. Sinn dieser Einstellung ist es eigentlich, Zeit bei der Generierung von Konfigurationsdaten aus AHDL- oder VHDL-Beschreibungen zu gewinnen, indem unveränderte Teile der Hardware-Beschreibung nicht erneut übersetzt werden. Dies scheint jedoch zu Inkonsistenzen wie folgender zu führen:
Das Hilfs-FPGA besaß bereits in einem sehr frühen Stadium seiner Entwicklung fünf Signalgruppen, die jeweils unabhängig voneinander auf Leitungen aufgeschaltet werden müssen, nämlich pc_if_data(_out), address, databus, disp_d7 und m_oe/m_we. Der Altera EPF 81188 verfügt aber nur über vier globale Tristate-Signale. Dennoch trat eine Fehlermeldung erst sehr spät auf, offenbar nach einem "Total Recompile", welche dann natürlich zunächst völlig unlogisch schien. Möglicherweise liegt auch das unerklärliche, zum Schluß verschwundene, Verhalten des Hilfs-FPGAs (siehe erster Punkt) zum Teil in Konfigurationsdaten begründet, die nicht korrekt aus der aktuellen Beschreibung abgeleitet wurden.
Das Benutzen von "Smart Recompile" ist also nicht ratsam, sinnvoll hingegen das der gegenteilig wirkenden Option "Total Recompile" (gleicher Effekt wie ein touch auf alle AHDL/VHDL-Dateien mit anschließender Neukompilation).

Die Lösung für das Problem eines fehlenden Output Enable-Signals (der Altera EPF 81188 besitzt nur vier, der EPF 81500 glücklicherweise zehn solche Signale) war ein externer Tristate-Treiber in einem "kleinen" FPGA (Altera Classic EP610). Dieses sitzt teilweise im Sockel eines vorher vorhandenen TTL-Bausteines, der vier NOR-Gatter zur Verfügung stellte, und hat durch entsprechende Programmierung dessen Funktion übernommen, ohne daß wesentliche Umverdrahtungen nötig wurden.

Unerfüllte Wünsche

Übernahme der Funktionalität des PC-Interfaces durch "Menüsystem" auf dem MPB; dieser Wunsch scheitert an seinem Logikbedarf.
Überwachen von Breakpoints durch das Hilfs-FPGA. Unbekannt ist der hierfür notwendige Logikbedarf, auf jeden Fall wäre noch ein deutlicher Arbeitsaufwand notwendig. Breakpoints hätten auch die bisherige Art des Datenflusses erweitert, denn das Hilfs-FPGA hätte von sich aus Alarm schlagen müssen, statt nur auf Anfragen und Befehle zu reagieren. Selbst wenn das Auftreten einer Breakpointbedingung nicht eigenständig gemeldet, sondern nur nach beliebig langer Zeit vom PC abgefragt worden wäre, so hätte doch das Hilfs-FPGA den Mikroprozessor sofort anhalten müssen, d.h. wiederum eigenständig nach single instruction / halted oder single step wechseln müssen.
Entwurf und Fertigung einer konventionellen Platine. Dies sollte bei zwei Verdrahtungslagen zügig möglich sein. Auch wenn jeder endgültige Entwurf sicherlich fünf oder sechs Lagen benötigt, kann so eine "Grundversorgung" aller ICs mit GND, VCC und einer Anzahl von Signalen sichergestellt werden. Vorzuziehen wären hier die Signale, die sich mit der geringsten Wahrscheinlichkeit noch ändern werden und einen starken Einsatz der Wrap-Pistole bedingen würden, also z.B. die breiten, mehrfach angeschlossenen Busse oder die vielen Leitungen zwischen Hilfs-FPGA und Mikroprozessor. Dadurch, daß diese Signale eher unauffällig auf der Platine integriert wären, würde sich die Fehlersuche bei den immer noch notwendigen Wrap-Verbindung optisch einfacher gestalten. Sollte sich die Anzahl der zusätzlichen Drahtverbindungen in Grenzen halten, wäre auch ein mehrfacher Aufbau der Platine möglich.