CODEXIS® Přihlaste se ke svému účtu
CODEXIS® ... 43/1997 Sb. Vyhláška, kterou se provádí zákon č. 21/1997 Sb., o kontrole vývozu a dovozu zboží a technologií podléhajících mezinárodním kontrolním režimům 4E Technologie

4E Technologie

43/1997 Sb. Vyhláška, kterou se provádí zákon č. 21/1997 Sb., o kontrole vývozu a dovozu zboží a technologií podléhajících mezinárodním kontrolním režimům

4E Technologie

4F001 "Technologie" podle Všeobecné poznámky k technologii pro "vývoj",

"výrobu" nebo "užití" zařízení nebo "softwaru" uvedeného ve 4A

nebo 4D.

Technická poznámka ke "SLOŽENÉMU TEORETICKÉMU VÝKONU" ("CTP")

Zkratky používané v této technické poznámce:

"CE" výpočetní prvek (typicky aritmeticko-logická jednotka)

FP pohyblivá řadová čárka

XP pevná řadová čárka

t doba výpočtu (provádění operací)

XOR logická funkce nonekvivalence

CPU základní (centrální) jednotka

TP teoretický výkon (jednoho "CE")

"CTP" složený teoretický výkon (více "CE")

R efektivní výpočetní rychlost

WL délka slova

L nastavení délky slova

* násobení

Doba výpočtu t se vyjadřuje v mikrosekundách, TP a

"CTP" se vyjadřuje v milionech teoretických

operací za sekundu (Mtops) a "WL" se vyjadřuje v bitech.

Shrnutí metod výpočtu "CTP"

"CTP" je mírou výpočetního výkonu udaného v Mtops. Při výpočtu

"CTP" konfigurace výpočetních prvků ("CE") se požadují následující

tři kroky:

1. Vypočítejte efektivní výpočetní rychlost R pro každý výpočetní

prvek ("CE");

2. Použijte nastavení délky slova (L) k výpočtu efektivní výpočetní

rychlosti R a k získání teoretického výkonu (TP) pro každý

výpočetní prvek ("CE");

3. Je-li těchto výpočetních prvků ("CE") více než jeden, teoretické

výkony TP slučte a získáte složený teoretický výkon ("CTP") pro

konfiguraci.

Podrobnosti těchto kroků jsou vysvětleny v následujících odstavcích.

Poznámka 1: Pokud je konfigurace více "CE" taková, že některé z nich sdílejí

paměťové subsystémy a další je nesdílejí, provádí se výpočet

"CTP" hierarchicky ve dvou krocích: za prvé se sdružují skupiny

"CE", které sdílejí paměť; za druhé se počítají "CTP" skupin

s použitím výpočetní metody pro násobné "CE", které nesdílejí

paměť.

Poznámka 2: Výpočetní prvky ("CE"), jejichž funkce je omezena na funkce

vstupu/výstupu a periferní funkce (např. řídicí jednotky disků,

řadiče komunikačních a zobrazovacích jednotek) se nezahrnují

do výpočtu "CTP".

Technická poznámka k "CTP"

Dále uvedená tabulka ukazuje způsob výpočtu efektivní výpočetní

rychlosti R pro každý výpočetní prvek ("CE"):

Krok 1: Efektivní výpočetní rychlost R

+-------------------------------------------------------------------------+

| Pro výpočetní prvky ("CE") realizující": Efektivní výpočetní rychlost R |

| Poznámka: Každý "CE" musí být |

| vyhodnocován nezávisle) |

+-------------------------------------------------------------------------+

1

Jenom XP ----------------

3 * (t )

xp add

(R ) Když se nevykonává sčítání, použijte:

xp

1

--------------

(t )

xp mult

Když se nevykonává ani sčítání ani násobení,

použijte nejrychlejší dostupnou

aritmetickou operaci, a to:

1

-------------

3 * t

xp

Viz poznámky X & Z

+----------------------------------------------------------------+

1 1

Jenom FP max-------, ----------

t add t mult

fp fp

(R )

fp

Viz poznámky X & Y

+----------------------------------------------------------------+

Jak FP tak XP

(R) Vypočítejte R , R

xp fp

+----------------------------------------------------------------+

1

Pro jednoduché logické procesory -----------

3 * t

log

nevykonávající žádnou

ze specifikovaných aritmetických

operací.

Kde t je doba výpočtu pro XOR nebo

log

nejrychlejší jednoduchá logická operace

u logického obvodu nerealizujícího XOR.

Viz poznámky X & Z.

+----------------------------------------------------------------+

Pro speciální logické procesory R = R'* WL/64

nepoužívající žádnou ze kde R'je počet výsledků za sekundu,

specifikovaných WL je počet bitů, na kterých probíhá

aritmetických nebo logických logická operace, a 64 je normalizační

operací faktor na 64-bitové operace.

+----------------------------------------------------------------+

Technická poznámka k "CTP"

Poznámka W: Pro výpočetní prvyk ("CE") s postupným zpracováním toku dat (pipeline), které jsou schopny zpracovávat více než jednu aritmetickou nebo logickou operaci v každém strojovém cyklu poté, co jsou naplněny daty, může být zavedena specifická rychlost v režimu pipeline. Efektivní výpočetní rychlost (R) pro takový "CE" je pak maximum rychlosti v režimech využívajících i nevyužívajících "pipeline".

Poznámka X: Pro výpočetní prvky, které vykonávají více aritmetických operací konkrétního typu v jednom cyklu (např. dvě sčítání v jednom cyklu) je doba výpočtu t dána vztahem:

doba cyklu

t = --------------------------------------------

počet identických operací ve strojovém cyklu

Výpočetní prvky ("CE"), které vykonávají různé typy aritmetických nebo logických operací v jednom strojovém cyklu, se pokládají za více samostatných výpočetních prvků, které pracují současně (např. výpočetní prvek provádějící sčítání a násobení v jednom cyklu se bere jako dva výpočetní prvky, z nichž první vykonává sčítání v jednom cyklu a druhý provádí násobení, rovněž v jednom cyklu).

Pokud jeden výpočetní prvek provádí skalární i vektorovou funkci, pak použijte hodnotu s kratší dobou výpočtu.

Poznámka Y: Jestliže "CE" neprovádí žádné sčítání nebo násobení s pohyblivou řádovou čárkou (FP), ale provádí dělení s pohyblivou řádovou čárkou, pak:

1

R = ------------

fp t

fpdivide

Jestliže "CE" vykonává operaci převrácené hodnoty v pohyblivé řádové čárce, ale nevykonává FP sčítání, násobení nebo dělení, pak:

1

R = ---------------

fp t

fpreciprocal

Nerealizuje-li se žádná ze specifikovaných instrukcí, je efektivní FP rychlost rovna nule.

Poznámka Z: V jednoduchých logických operacích vykonává jedna instrukce jednu logickou manipulaci s ne více než dvěma operandy daných délek.

Ve složitých logických operacích vykonává jedna instrukce více logických manipulací, aby vytvořila jeden nebo více výsledků ze dvou nebo více operandů.

Technická poznámka k "CTP"

Rychlosti je třeba počítat pro všechny podporované délky operandů uvažujíce jak standardní režim zpracování, tak "pipeline" (pokud přichází v úvahu) za použití nejrychlejší výkonné instrukce pro každou délku operandu v pořadí:

1. Pipelinové operace a operace registr - registr. Vypusťte extrémně krátké operační časy, které se mohou vyskytnout pro operace na předem určeném operandu nebo předem určených operandech (například násobení nulou nebo 1). Nerealizují-li se žádné operace registr - registr, pokračujte podle bodu (2).

2. Rychlejší z operací registr - paměť nebo paměť - registr; pokud tyto také neexistují, pokračujte podle bodu (3).

3. Paměť - paměť.

V každém výše uvedeném případě použijte nejkratší dobu operace zaručovanou výrobcem.

Krok 2: TP pro každou podporovanou délku operandu WL

Nastavte efektivní rychlost R (nebo R') pomocí nastavení délky slova L takto:

TP = R * L,

kde L = (1/3 + WL/96)

Poznámka: Délka slova WL použitá v těchto výpočtech je délka operandu v bitech. (Používají-li se operandy o různé délce, vyberte největší délku slova.) Kombinace jednotek pro zpracování mantisy a exponentu u procesoru pracujícího v pohyblivé řádové čárce se považuje pro účely výpočty "CTP" za jeden "CE" s délkou slova (WL) rovnou počtu bitů v datové reprezentaci (typicky 32 nebo 64).

Toto nastavení se neuplatňuje na specializované logické procesory, které nepoužívají instrukce XOR. V tomto případě:

TP = R

Vyberte maximální výslednou hodnotu TP pro:

Každý "CE" realizující operace pouze s pevnou řádovou čárkou (Rxp);

Každý "CE" realizující operace pouze s pohyblivou řádovou čárkou (Rfp);

Každý "CE" realizující kombinaci operací v pohyblivé a pevné řádové čárce (R);

Každý jednoduchý logický procesor nevykonávající žádnou ze specifikovaných aritmetických operací; a

Každý speciální logický procesor, nepoužívající žádnou ze specifikovaných aritmetických nebo logických operací.

Technická poznámka k "CTP"

Krok 3: "CTP" pro kombinace "CE" včetně CPU

Pro základní jednotku (CPU) s jedním výpočetním prvkem

"CTP" = TP

( pro výpočetní prvky ("CE") vykonávající operace s pevnou i pohyblivou řádovou čárkou je:

TP = max (TP , TP )

fp xp

"CTP" pro kombinaci více výpočetních prvků pracujících současně se počítá takto:

Poznámka 1:

V případě konfigurací, které nedovolují současný běh všech výpočetních prvků je třeba použít tu možnou konfiguraci výpočetních prvků, která zajišťuje největší "CTP". Než se odvodí "CTP" konfigurace, bere se TP každého z přispívajících výpočetních prvků jako maximální teoreticky možná hodnota, dosažitelná při samostatné činnosti výpočetního prvku.

POZN.:

K určení možných kombinací současně pracujících "CE" generujte posloupnost instrukcí, která iniciuje operace ve více "CE" počínaje nejpomalejším "CE" (to je tím výpočetním prvkem, který potřebuje nejvíce cyklů k provedení operace) a konče nejrychlejším "CE". Pro každý cyklus posloupnosti platí, že ta kombinace "CE", která je funkční během tohoto cyklu, je možnou kombinací. Instrukční posloupnost musí brát v úvahu všechna technická nebo i architektonická omezení překrývajících se operací.

Poznámka 2:

Jednotlivý čip nebo montážní deska může obsahovat více výpočetních prvků.

Poznámka 3:

Existence současných operací se předpokládá, když výrobce počítače uvádí v manuálu nebo brožuře počítače, paralelní nebo souběžnou funkci nebo zpracování.

Poznámka 4:

Hodnoty "CTP" se nesdružují pro kombinace "CE", které jsou propojeny "lokální sítí" (LAN), rozlehlou sítí (WAN), sdílenými vstupními a výstupními spoji či zařízeními nebo řadiči vstupů/výstupů a libovolnými telekomunikačními spojeními, realizovanými softwarově.

Poznámka 5:

Hodnoty "CTP" je naopak nutno sdružovat pro vícenásobné sestavy "CE", které jsou speciálně navrženy k tomu, aby zvýšily výkonnost, a to v případech, kdy "CE" pracují současně a sdílejí paměť, nebo když se jedná o kombinace vícenásobná paměť/"CE", jež fungují současně a využívají specializované technické prostředky ("hardware").

Sdružování se nepoužije na "elektronické sestavy" popsané v položce 4A003.c.

CTP = TP + C * TP + ... + C * TP ,

1 2 2 n n

kde TP jsou řazeny podle hodnoty, s TP1 je nejvyšší, TP2 druhý nejvyšší ..., a TPn nejnižší; Ci je koeficient určený vahou propojení mezi výpočetními prvky, a to takto:

Pro více výpočetních prvků ("CE") pracujících současně a sdílejících paměť:

C = C = C = ... = C = 0,75

2 3 4 n

Poznámka 1: Pokud hodnota takto vypočteného "CTP" nepřevýší 194 Mtops, lze pro výpočet Ci použít vztahu:

0,75

Ci = ---- (i = 2, ..., n),

√m

kde m je počet "CE" nebo skupin "CE", sdílejících přístup, platí-li, že:

1. TPj každého "CE" nebo skupin "CE" nepřevyšuje 30 Mtops;

2. "CE" nebo skupiny "CE" sdílejí přístup do hlavní paměti (paměť cache se neuvažuje) jedním kanálem; a.

3. Pouze jeden "CE" nebo jedna skupina "CE" může v daný okamžik používat kanál.

POZN.

Toto se nevztahuje na položky kontrolované podle Kategorie 3.

Poznámka 2:

Výpočetní prvky ("CE") sdílejí paměť, když mají přístup do nějakého společného segmentu paměti s obvody v pevné fázi. Tato paměť může obsahovat rychlou vyrovnávací paměť cache, hlavní paměť nebo jinou vnitřní paměť. Periferní paměťová zařízení, jako jsou diskové jednotky, páskové jednotky nebo RAM disky, sem nepatří.

Pro více výpočetních prvků nebo skupin "CE", nesdílejících paměť, propojených jedním nebo více datovými kanály, platí:

Ci = 0,75 * k (i = 2, ... 32) (viz poznámka na konci)

i

= 0,60 * k (i = 33, ... 64)

i

= 0,45 * k (i = 65, ... 256)

i

= 0,30 * k (i > 256)

i

Hodnota C je odvozena od počtu "CE", ne od počtu uzlových bodů

i

kde: k = min (S /K , 1) a

i i r

K = normalizační faktor o hodnotě 20 MByte/s

r

S = součet maximálních přenosových rychlostí (v MByte/s)

i

pro všechny datové kanály připojené do i-tého "CE" nebo

skupiny "CE" sdílejících paměť.

Počítáme-li Ci pro skupinu "CE", pak číslo prvního "CE" ve skupině definuje vztah pro výpočet Ci. Tak např. při sdružení skupin obsahujících každá 3 "CE", dvacátá druhá skupina bude obsahovat "CE"64, "CE"65 a "CE"66. Charakteristická mez Ci pro tuto skupinu je pak 0,60.

Sdružování ("CE" nebo skupin "CE") musí být od nejrychlejšího do nejpomalejšího, tzn.:

TP1 ≥ TP2 ≥ ... ≥ TPn

a v případě TPi = TPi+1 od největší do nejmenší rychlosti, t.j.:

Ci ≥ Ci+1

Poznámka: Faktor k se nepoužije na "CE" až "CE" , pokud TP těchto "CE"

i 2 12 i

nebo skupin "CE" je více než 50 Mtops, tzn. C pro "CE" až "CE"

i 2 12

je vždy 0,75.