Datenmenge: Unterschied zwischen den Versionen

Datenmenge: Unterschied zwischen den Versionen

imported>Horst Gräbner
K (Änderungen von 82.218.219.136 (Diskussion) auf die letzte Version von Trustable zurückgesetzt)
 
imported>RoBri
K (Änderungen von 2003:E2:9F01:5A00:2941:6E92:105:216A (Diskussion) auf die letzte Version von Leyo zurückgesetzt)
 
Zeile 1: Zeile 1:
Die '''Datenmenge''' ist ein Maß für die Menge von [[Daten]]. Die Grundeinheit der Datenmenge ist das [[Bit]]. Daten dienen dem Speichern und Übertragen von [[Information]], wobei zu beachten ist, dass der [[Informationsgehalt]] einer [[Nachricht]] nicht gleich der Datenmenge ist, auch wenn in diesem Zusammenhang häufig das Wort ''Information'' verwendet wird, wenn Daten gemeint sind. Der Informationsgehalt kann im Gegensatz zur Datenmenge nicht unmittelbar abgelesen werden, und es gibt verschiedene Ansätze, ihn zu bestimmen. Die Datenmenge, die in einer [[Datei]] gespeichert ist, wird als '''Dateigröße''' bezeichnet. Bei [[Datenträger]]n wird die Datenmenge zur Angabe des freien und des maximal speicherbaren '''Datenvolumens''' ([[Speicherkapazität]]) verwendet.
Die '''Datenmenge''' ist ein Maß für die Menge von [[Daten]]. Die Grundeinheit der Datenmenge ist das [[Bit]].  
 
Daten dienen dem Speichern und dem Übertragen von [[Information]], wobei zu beachten ist, dass der [[Informationsgehalt]] einer [[Nachricht]] nicht gleich der Datenmenge ist, auch wenn in diesem Zusammenhang häufig das Wort ''Information'' verwendet wird, wenn Daten gemeint sind. Der Informationsgehalt kann im Gegensatz zur Datenmenge nicht unmittelbar abgelesen werden, und es gibt verschiedene Ansätze, ihn zu bestimmen. Die Datenmenge, die in einer [[Datei]] gespeichert ist, wird als '''Dateigröße''' bezeichnet. Bei [[Datenträger]]n wird die Datenmenge zur Angabe des freien und des maximal speicherbaren '''Datenvolumens''' ([[Speicherkapazität]]) verwendet.


Die Datenmenge, die benötigt wird, um eine gegebene Information zu speichern, hängt einerseits von der [[Komplexität]] der Information und andererseits vom [[Kodierung]]sverfahren ab. Für umfangreiche ''Datenmengen'' gibt es [[Datenkompression|Kompressionsverfahren]], die die Menge der Daten reduzieren, aber die gleiche Information speichern. Dabei wird ein geeignetes Kodierungsverfahren verwendet, um den [[Informationsgehalt]] der einzelnen Zeichen zu erhöhen bzw. [[Entropie (Informationstheorie)|Entropie]] der [[Nachricht]] zu verringern (siehe auch [[Entropiekodierung]]).
Die Datenmenge, die benötigt wird, um eine gegebene Information zu speichern, hängt einerseits von der [[Komplexität]] der Information und andererseits vom [[Kodierung]]sverfahren ab. Für umfangreiche ''Datenmengen'' gibt es [[Datenkompression|Kompressionsverfahren]], die die Menge der Daten reduzieren, aber die gleiche Information speichern. Dabei wird ein geeignetes Kodierungsverfahren verwendet, um den [[Informationsgehalt]] der einzelnen Zeichen zu erhöhen bzw. [[Entropie (Informationstheorie)|Entropie]] der [[Nachricht]] zu verringern (siehe auch [[Entropiekodierung]]).


Daten müssen nicht unbedingt explizit als Bits kodiert oder in einem Computer gespeichert sein. Daten sind überall in der Natur und unserer Alltagswelt. Die größten Datenmengen stecken in unserem [[Gehirn]], in unseren [[Bibliothek]]en, [[Buch|Büchern]], [[Filmkunst|Filmen]], [[Abbild|Bildern]] und [[Computer]]n, im [[Genom|Erbgut]] und den [[Molekül]]strukturen der belebten Natur, in den [[Physikalisches Gesetz|Gesetzen der unbelebten und belebten Natur]], in der Struktur des gesamten [[Universum]]s und die maximal denkbare Information in der Geschichte des gesamten Weltraums.
Daten müssen nicht unbedingt explizit als Bits kodiert oder in einem Computer gespeichert sein. Daten sind überall in der Natur und unserer Alltagswelt. Die größten Datenmengen stecken in unserem [[Gehirn]], in unseren [[Bibliothek]]en, [[Buch|Büchern]], [[Filmkunst|Filmen]], [[Abbild|Bildern]] und [[Computer]]n, im [[Genom|Erbgut]] und den [[Molekülstruktur]]en der belebten Natur, in den [[Physikalisches Gesetz|Gesetzen der unbelebten und belebten Natur]], in der Struktur des gesamten [[Universum]]s und die maximal denkbare Information in der Geschichte des gesamten Weltraums.


== Grundeinheit ==
== Grundeinheit ==
Zeile 27: Zeile 29:
Die Summation der Bits von 0 bis 7 (entsprechend 1 Byte) 2<sup>8</sup>-1, können also einen dezimalen Wertebereich von 0 bis 255 abdecken.
Die Summation der Bits von 0 bis 7 (entsprechend 1 Byte) 2<sup>8</sup>-1, können also einen dezimalen Wertebereich von 0 bis 255 abdecken.
* 8 Bit <math>\Rightarrow</math> ''Z'' = 256, wenn ''D'' = 8, da 2<sup>8</sup> = 256
* 8 Bit <math>\Rightarrow</math> ''Z'' = 256, wenn ''D'' = 8, da 2<sup>8</sup> = 256
...
* 63 Bit <math>\Rightarrow</math> ''Z'' = 9223372036854775808, wenn ''D'' = 63, da 2<sup>63</sup> = 9223372036854775808
* 63 Bit <math>\Rightarrow</math> ''Z'' = 9223372036854775808, wenn ''D'' = 63, da 2<sup>63</sup> = 9223372036854775808


Zeile 34: Zeile 36:


== Weitere Einheiten ==
== Weitere Einheiten ==
Neben dem Bit ist die gängigste Einheit für die Datenmenge das [[Byte]] (oder [[Oktett (Informatik)|Oktett]]), das aus 8 Bits besteht. Das hat historische Gründe: viele Geräte waren so ausgelegt, dass sie 8 Bit gleichzeitig bearbeiten konnten (heute sind das meist 32 oder 64 Bit - siehe dazu [[Datenwort]]), 8 Bit wurden also von der [[Central Processing Unit|Verarbeitungseinheit]] als ''eine [[Zahl]]'' angesehen. Des Weiteren werden [[Buchstaben]] von den meisten [[Zeichensatz|Zeichensätzen]], insbesondere von [[ISO 8859]], als ein Byte dargestellt.
Neben dem Bit ist die gängigste Einheit für die Datenmenge das [[Byte]] (oder [[Oktett (Informatik)|Oktett]]), das aus 8 Bits besteht. Das hat historische Gründe: Viele Geräte waren so ausgelegt, dass sie 8 Bit gleichzeitig bearbeiten konnten (heute sind das meist 32 oder 64 Bit siehe dazu [[Datenwort]]), 8 Bit wurden also von der [[Central Processing Unit|Verarbeitungseinheit]] als ''eine [[Zahl]]'' angesehen. Des Weiteren werden [[Buchstaben]] von den meisten [[Zeichensatz|Zeichensätzen]], insbesondere von [[ISO 8859]], als ein Byte dargestellt.


In der Geschichte der [[Computer]] gab es auch Systeme, die nur 5 Bit zu einem Byte zusammenfassten, und es gab auch Systeme, die 13 Bit zu einem Byte zusammenfassten.
In der Geschichte der [[Computer]] gab es auch Systeme, die nur 5 Bit zu einem Byte zusammenfassten, und es gab auch Systeme, die 13 Bit zu einem Byte zusammenfassten.
Zeile 42: Zeile 44:
== Beispiele für Datenmengen ==
== Beispiele für Datenmengen ==
''[[Bit]]''
''[[Bit]]''
* 1&nbsp;Bit - (2<sup>1</sup> = 2 mögliche Zustände), z.&nbsp;B. ''0'' oder ''1'' bzw. ''falsch'' oder ''wahr''
* 1&nbsp;Bit (2<sup>1</sup> = 2 mögliche Zustände), z.&nbsp;B. ''0'' oder ''1'' bzw. ''falsch'' oder ''wahr''
* 5&nbsp;Bit - (2<sup>5</sup> = 32 mögliche Zustände), z.&nbsp;B. kann damit der Großbuchstabenvorrat des [[lateinisches Alphabet|lateinischen Alphabets]] abgebildet werden
* 5&nbsp;Bit (2<sup>5</sup> = 32 mögliche Zustände), z.&nbsp;B. kann damit der Großbuchstabenvorrat des [[lateinisches Alphabet|lateinischen Alphabets]] abgebildet werden
* 7&nbsp;Bit - (2<sup>7</sup> = 128 mögliche Zustände), z.&nbsp;B. ein Zeichen aus dem [[ASCII]]-Zeichensatz
* 7&nbsp;Bit (2<sup>7</sup> = 128 mögliche Zustände), z.&nbsp;B. ein Zeichen aus dem [[ASCII]]-Zeichensatz
''[[Nibble]]'' oder ''Halb-Byte''
''[[Nibble]]'' oder ''Halb-Byte''
* 1&nbsp;Nibble - (2<sup>4</sup> = 16 mögliche Zustände), z.&nbsp;B. ''0''…''15''
* 1&nbsp;Nibble (2<sup>4</sup> = 16 mögliche Zustände), z.&nbsp;B. ''0''…''15''
* 2&nbsp;Nibble - (2<sup>8</sup> = 256 mögliche Zustände), also 1 Oktett
* 2&nbsp;Nibble (2<sup>8</sup> = 256 mögliche Zustände), also 1 Oktett


''[[Byte]]'' oder ''Oktett'' (8&nbsp;Bit)
''[[Byte]]'' oder ''Oktett'' (8&nbsp;Bit)
* 1&nbsp;Oktett - (2<sup>8</sup> = 256 mögliche Zustände), z.&nbsp;B. ein Zeichen aus der ANSI-Codierung (erweitertes lateinisches [[Alphabet]])
* 1&nbsp;Oktett (2<sup>8</sup> = 256 mögliche Zustände), z.&nbsp;B. ein Zeichen aus der ANSI-Codierung (erweitertes lateinisches [[Alphabet]])
* 2&nbsp;Oktett - (2<sup>16</sup> = 65.536 mögliche Zustände)
* 2&nbsp;Oktett (2<sup>16</sup> = 65.536 mögliche Zustände)
* 4&nbsp;Oktett - (2<sup>32</sup> = etwa 4,3&nbsp;Milliarden mögliche Zustände), z.&nbsp;B. ein Schriftzeichen im [[UTF-32]]-Format
* 4&nbsp;Oktett (2<sup>32</sup> = etwa 4,3&nbsp;Milliarden mögliche Zustände), z.&nbsp;B. ein Schriftzeichen im [[UTF-32]]-Format


=== Relevante Präfixe ===
=== Relevante Präfixe ===
Griechische und Italienische [[Vorsätze für Maßeinheiten]] werden üblicherweise [[Bit]]s und [[Byte]]s vorangestellt. Im Folgenden werden die SI-[[Präfix]]e (k, M, T, G, …) in ihrer dezimalen Bedeutung verwendet. In der IT-Praxis werden für Datenmengen die SI-Präfixe meist als Binärpräfixe (1 kB = 1024 Byte, …) verwendet. Die Akzeptanz der dafür vorgesehenen IEC-[[Binärpräfix]]e (Ki, Mi, Gi, …) ist in der IT-Branche gering, auch mit den normalen Namen wird normalerweise die 1024 Byte Umrechnung impliziert.
Griechische und italienische [[Vorsätze für Maßeinheiten]] werden üblicherweise [[Bit]]s und [[Byte]]s vorangestellt. Im Folgenden werden die SI-[[Präfix]]e (k, M, T, G, …) in ihrer dezimalen Bedeutung verwendet. In der IT-Praxis werden für Datenmengen die SI-Präfixe meist als Binärpräfixe (1 kB = 1024 Byte, …) verwendet. Die Akzeptanz der dafür vorgesehenen IEC-[[Binärpräfix]]e (Ki, Mi, Gi, …) ist in der IT-Branche gering, auch mit den normalen Namen wird normalerweise die 1024-Byte-Umrechnung impliziert.


==== Kilo und Kibi ====
==== Kilo und Kibi ====
Zeile 61: Zeile 63:
''Kibibyte'' (KiB) (2<sup>10</sup>&nbsp;Byte = 1024&nbsp;Byte), üblicherweise wird jedoch ''KB'' zur Unterscheidung von ''kB'' geschrieben, weil es geläufiger ist.
''Kibibyte'' (KiB) (2<sup>10</sup>&nbsp;Byte = 1024&nbsp;Byte), üblicherweise wird jedoch ''KB'' zur Unterscheidung von ''kB'' geschrieben, weil es geläufiger ist.
* ca. 1–2&nbsp;kB: eine [[Normseite]] als Text (ANSI/ASCII-kodiert)
* ca. 1–2&nbsp;kB: eine [[Normseite]] als Text (ANSI/ASCII-kodiert)
* ca. 5&nbsp;kB: eine A4-Schreibmaschinenseite mit 63 Zeilen zu je 80 Zeichen (ANSI/ASCII-kodiert)
* ca. 5&nbsp;kB: eine [[Schreibmaschine]]nseite mit 63 Zeilen zu je 80 Zeichen (ANSI/ASCII-kodiert) im [[A4-Format]]
* ca. 79&nbsp;kB: Totaler Speicherplatz des Navigationscomputers der Mondlandefähre von [[Apollo 11]] 1969 <ref>http://history.nasa.gov/alsj/a11/a11.1201-pa.html</ref>
* ca. 79&nbsp;kB: Totaler Speicherplatz des Navigationscomputers der Mondlandefähre von [[Apollo 11]] 1969<ref>http://history.nasa.gov/alsj/a11/a11.1201-pa.html</ref>
* 1440&nbsp;KiB: eine High-Density-3,5-Zoll-[[Diskette]]
* 1440&nbsp;KiB: eine High-Density-3,5-Zoll-[[Diskette]]


Zeile 86: Zeile 88:
''Pebibyte'' (PiB) (2<sup>50</sup>&nbsp;Byte = 1.125.899.906.842.624 Byte)
''Pebibyte'' (PiB) (2<sup>50</sup>&nbsp;Byte = 1.125.899.906.842.624 Byte)
* Die Speicherkapazitäten der weltweit größten Rechenzentren lagen Ende 2002 zwischen 1&nbsp;PB und 10&nbsp;PB
* Die Speicherkapazitäten der weltweit größten Rechenzentren lagen Ende 2002 zwischen 1&nbsp;PB und 10&nbsp;PB
* Im Jahr 1986 war die effektive Kapazität der Welt, (optimal komprimierte) Informationen durch (bidirektionale) [[Telekommunikationsnetz]]e auszutauschen, 281 [[Petabyte]]<ref name="HilbertLopez2011">[http://www.sciencemag.org/content/332/6025/60 "The World’s Technological Capacity to Store, Communicate, and Compute Information"], Martin Hilbert and Priscila López (2011), [[Science]], 332(6025), 60-65; kostenfreien Zugriff auf den Artikel gibt es über diese Seite: martinhilbert.net/WorldInfoCapacity.html</ref>.
* Im Jahr 1986 war die effektive Kapazität der Welt, (optimal komprimierte) Informationen durch (bidirektionale) [[Telekommunikationsnetz]]e auszutauschen, 281 [[Petabyte]]<ref name="HilbertLopez2011">[http://www.sciencemag.org/content/332/6025/60 "The World’s Technological Capacity to Store, Communicate, and Compute Information"], Martin Hilbert and Priscila López (2011), [[Science]], 332(6025), 60–65; kostenfreien Zugriff auf den Artikel gibt es über diese Seite: martinhilbert.net/WorldInfoCapacity.html</ref>.


==== Exa und Exbi ====
==== Exa und Exbi ====
Zeile 92: Zeile 94:
''Exbibyte'' (EiB) (2<sup>60</sup>&nbsp;Byte = 1.152.921.504.606.846.976 Byte)
''Exbibyte'' (EiB) (2<sup>60</sup>&nbsp;Byte = 1.152.921.504.606.846.976 Byte)
* Die Gesamtheit aller gedruckten Werke wird auf 0,2&nbsp;EB geschätzt
* Die Gesamtheit aller gedruckten Werke wird auf 0,2&nbsp;EB geschätzt
* Die effektive Kapazität der Welt, Informationen durch (bidirektionale) [[Telekommunikationsnetz|Telekommunikationsnetze]] auszutauschen, war 65 (optimal komprimierte) [[Byte|Exabyte]] im Jahr 2007, und die globale technologische Kapazität Informationen zu speichern betrug geschätzte 295 (optimal komprimierte) Exabyte im Jahr 2007.<ref name="HilbertLopez2011"/>
* Die effektive Kapazität der Welt, Informationen durch (bidirektionale) [[Telekommunikationsnetz]]e auszutauschen, war 65 (optimal komprimierte) [[Byte|Exabyte]] im Jahr 2007, und die globale technologische Kapazität Informationen zu speichern betrug geschätzte 295 (optimal komprimierte) Exabyte im Jahr 2007.<ref name="HilbertLopez2011"/>


==== Zetta und Zebi ====
==== Zetta und Zebi ====
''Zettabyte'' (ZB) (10<sup>21</sup>&nbsp;Byte),<br/>
''Zettabyte'' (ZB) (10<sup>21</sup>&nbsp;Byte),<br/>
''Zebibyte'' (ZiB) (2<sup>70</sup>&nbsp;Byte = 1.180.591.620.717.411.303.424 Byte)
''Zebibyte'' (ZiB) (2<sup>70</sup>&nbsp;Byte = 1.180.591.620.717.411.303.424 Byte)
* Die weltweite technische Kapazität, Informationen über ([[unidirektional]]e) [[Broadcast]]- und [[Rundfunk]]-[[Kommunikationssystem|Netzwerke]] zu senden, betrug im Jahr 2007 geschätzte 1,9 (optimal komprimierte) [[Byte|Zettabyte]].<ref name="HilbertLopez2011"/> Dies ist das informationale [[Äquivalenz|Äquivalent]] von 175&nbsp;[[Tageszeitung]]en pro Kopf pro Tag für 2007.<ref name="Hilbertvideo2011">[https://www.youtube.com/watch?v=iIKPjOuwqHo Video Animation über The World’s Technological Capacity to Store, Communicate, and Compute Information from 1986 to 2010]</ref>
* Die weltweite technische Kapazität, Informationen über ([[unidirektional]]e) [[Broadcast]]- und [[Rundfunk]]-[[Kommunikationssystem|Netzwerke]] zu senden, betrug im Jahr 2007 geschätzte 1,9 (optimal komprimierte) [[Byte|Zettabyte]].<ref name="HilbertLopez2011"/> Dies ist das informationale Äquivalent von 175&nbsp;[[Tageszeitung]]en pro Kopf pro Tag für 2007.<ref name="Hilbertvideo2011">[https://www.youtube.com/watch?v=iIKPjOuwqHo Video Animation über The World’s Technological Capacity to Store, Communicate, and Compute Information from 1986 to 2010]</ref>


==== Yotta und Yobi ====
==== Yotta und Yobi ====
Zeile 106: Zeile 108:
== Siehe auch ==
== Siehe auch ==
* [[Informationsexplosion]]
* [[Informationsexplosion]]
* [[Vergleich optischer Datenträger]]: CD, DVD, HD DVD und Blu-ray Disc


== Quellen ==
== Quellen ==
Zeile 116: Zeile 119:
[[Kategorie:Theoretische Informatik]]
[[Kategorie:Theoretische Informatik]]
[[Kategorie:Messgröße (Informationstechnik)]]
[[Kategorie:Messgröße (Informationstechnik)]]
[[Kategorie:Größenordnung]]

Aktuelle Version vom 19. Januar 2022, 16:12 Uhr

Die Datenmenge ist ein Maß für die Menge von Daten. Die Grundeinheit der Datenmenge ist das Bit.

Daten dienen dem Speichern und dem Übertragen von Information, wobei zu beachten ist, dass der Informationsgehalt einer Nachricht nicht gleich der Datenmenge ist, auch wenn in diesem Zusammenhang häufig das Wort Information verwendet wird, wenn Daten gemeint sind. Der Informationsgehalt kann im Gegensatz zur Datenmenge nicht unmittelbar abgelesen werden, und es gibt verschiedene Ansätze, ihn zu bestimmen. Die Datenmenge, die in einer Datei gespeichert ist, wird als Dateigröße bezeichnet. Bei Datenträgern wird die Datenmenge zur Angabe des freien und des maximal speicherbaren Datenvolumens (Speicherkapazität) verwendet.

Die Datenmenge, die benötigt wird, um eine gegebene Information zu speichern, hängt einerseits von der Komplexität der Information und andererseits vom Kodierungsverfahren ab. Für umfangreiche Datenmengen gibt es Kompressionsverfahren, die die Menge der Daten reduzieren, aber die gleiche Information speichern. Dabei wird ein geeignetes Kodierungsverfahren verwendet, um den Informationsgehalt der einzelnen Zeichen zu erhöhen bzw. Entropie der Nachricht zu verringern (siehe auch Entropiekodierung).

Daten müssen nicht unbedingt explizit als Bits kodiert oder in einem Computer gespeichert sein. Daten sind überall in der Natur und unserer Alltagswelt. Die größten Datenmengen stecken in unserem Gehirn, in unseren Bibliotheken, Büchern, Filmen, Bildern und Computern, im Erbgut und den Molekülstrukturen der belebten Natur, in den Gesetzen der unbelebten und belebten Natur, in der Struktur des gesamten Universums und die maximal denkbare Information in der Geschichte des gesamten Weltraums.

Grundeinheit

Die kleinste darstellbare Dateneinheit ist das Bit. Bit ist die Kurzform für Binary digit, dt. Binärziffer. Ein Datenspeicher mit einem Bit Speicherkapazität hat also nur einen Speicherplatz mit 2 Möglichkeiten: zum Beispiel „besetzt oder leer“, „an oder aus“, „Kerbe oder keine Kerbe“. Die Datenmenge, die in einer einzelnen Ja/Nein-Entscheidung steckt, beträgt demnach genau 1 Bit. Für vier mögliche Werte (zum Beispiel rot, gelb, grün, blau) werden zwei Bits benötigt, die sich auf vier verschiedene Weisen kombinieren lassen (00, 01, 10, 11).

Formal bedeutet das, dass die benötigte Datenmenge $ D $ (Anzahl von Bits) das aufgerundete Ergebnis des Logarithmus zur Basis 2 der Zahl $ Z $ der möglichen Werte ist.

$ D=\left\lceil \operatorname {ld} (Z)\right\rceil $

beziehungsweise umgekehrt: Die Anzahl der möglichen Werte ist 2 hoch die Anzahl der Bits:

$ Z=2^{D} $

Also zum Beispiel

  • 0 Bit $ \Rightarrow $ Z = 1, wenn D = 0, da 20 = 1
  • 1 Bit $ \Rightarrow $ Z = 2, wenn D = 1, da 21 = 2
  • 2 Bit $ \Rightarrow $ Z = 4, wenn D = 2, da 22 = 4
$ \vdots $
  • 7 Bit $ \Rightarrow $ Z = 128, wenn D = 7, da 27 = 128

Die Summation der Bits von 0 bis 7 (entsprechend 1 Byte) 28-1, können also einen dezimalen Wertebereich von 0 bis 255 abdecken.

  • 8 Bit $ \Rightarrow $ Z = 256, wenn D = 8, da 28 = 256

  • 63 Bit $ \Rightarrow $ Z = 9223372036854775808, wenn D = 63, da 263 = 9223372036854775808

Für D = 1 KiB ist die Zahl Z der möglichen Werte sehr groß: 21024 ≈ 1,8 · 10308.

Weitere Einheiten

Neben dem Bit ist die gängigste Einheit für die Datenmenge das Byte (oder Oktett), das aus 8 Bits besteht. Das hat historische Gründe: Viele Geräte waren so ausgelegt, dass sie 8 Bit gleichzeitig bearbeiten konnten (heute sind das meist 32 oder 64 Bit – siehe dazu Datenwort), 8 Bit wurden also von der Verarbeitungseinheit als eine Zahl angesehen. Des Weiteren werden Buchstaben von den meisten Zeichensätzen, insbesondere von ISO 8859, als ein Byte dargestellt.

In der Geschichte der Computer gab es auch Systeme, die nur 5 Bit zu einem Byte zusammenfassten, und es gab auch Systeme, die 13 Bit zu einem Byte zusammenfassten.

Zur Bezeichnung größerer Datenmengen werden die Einheitszeichen bit für Bit und B für Byte mit den gängigen Vorsätzen für Maßeinheiten versehen, also kilo (kbit/kB), mega (Mbit/MB), giga (Gbit/GB), tera (Tbit/TB) und so weiter. Für auf Zweierpotenzen basierende Datenmengen, wie sie beispielsweise in Halbleiterspeichern auftreten, gibt es spezielle Binärpräfixe.

Beispiele für Datenmengen

Bit

  • 1 Bit – (21 = 2 mögliche Zustände), z. B. 0 oder 1 bzw. falsch oder wahr
  • 5 Bit – (25 = 32 mögliche Zustände), z. B. kann damit der Großbuchstabenvorrat des lateinischen Alphabets abgebildet werden
  • 7 Bit – (27 = 128 mögliche Zustände), z. B. ein Zeichen aus dem ASCII-Zeichensatz

Nibble oder Halb-Byte

  • 1 Nibble – (24 = 16 mögliche Zustände), z. B. 015
  • 2 Nibble – (28 = 256 mögliche Zustände), also 1 Oktett

Byte oder Oktett (8 Bit)

  • 1 Oktett – (28 = 256 mögliche Zustände), z. B. ein Zeichen aus der ANSI-Codierung (erweitertes lateinisches Alphabet)
  • 2 Oktett – (216 = 65.536 mögliche Zustände)
  • 4 Oktett – (232 = etwa 4,3 Milliarden mögliche Zustände), z. B. ein Schriftzeichen im UTF-32-Format

Relevante Präfixe

Griechische und italienische Vorsätze für Maßeinheiten werden üblicherweise Bits und Bytes vorangestellt. Im Folgenden werden die SI-Präfixe (k, M, T, G, …) in ihrer dezimalen Bedeutung verwendet. In der IT-Praxis werden für Datenmengen die SI-Präfixe meist als Binärpräfixe (1 kB = 1024 Byte, …) verwendet. Die Akzeptanz der dafür vorgesehenen IEC-Binärpräfixe (Ki, Mi, Gi, …) ist in der IT-Branche gering, auch mit den normalen Namen wird normalerweise die 1024-Byte-Umrechnung impliziert.

Kilo und Kibi

Kilobyte (kB) (103 Byte = 1000 Byte),
Kibibyte (KiB) (210 Byte = 1024 Byte), üblicherweise wird jedoch KB zur Unterscheidung von kB geschrieben, weil es geläufiger ist.

  • ca. 1–2 kB: eine Normseite als Text (ANSI/ASCII-kodiert)
  • ca. 5 kB: eine Schreibmaschinenseite mit 63 Zeilen zu je 80 Zeichen (ANSI/ASCII-kodiert) im A4-Format
  • ca. 79 kB: Totaler Speicherplatz des Navigationscomputers der Mondlandefähre von Apollo 11 1969[1]
  • 1440 KiB: eine High-Density-3,5-Zoll-Diskette

Mega und Mebi

Megabyte (MB) (106 Byte = 1.000.000 Byte),
Mebibyte (MiB) (220 Byte = 1.048.576 Byte)

  • ca. 4 MB: die Bibel als Text (ANSI/ASCII-kodiert)
  • ca. 703,1 MiB also ca. 737,25 MB: eine konventionelle 700-MB-Daten-CD-ROM

Giga und Gibi

Gigabyte (GB) (109 Byte = 1.000.000.000 Byte),
Gibibyte (GiB) (230 Byte = 1.073.741.824 Byte)

  • ca. 4,38 GiB also ca. 4,7 GB: eine DVD±R
  • ca. 5 GB: ein komprimierter Spielfilm in DVD-Qualität (bei MPEG-2-Kompression)

Tera und Tebi

Terabyte (TB) (1012 Byte = 1000 GB),
Tebibyte (TiB) (240 Byte = 1.099.511.627.776 Byte)

  • Eine Datenbank, die 10 Milliarden Menschen mit Datensätzen von je 1 kB Größe erfasst, braucht 10 TB Speicher.

Peta und Pebi

Petabyte (PB) (1015 Byte = 1.000.000 GB),
Pebibyte (PiB) (250 Byte = 1.125.899.906.842.624 Byte)

  • Die Speicherkapazitäten der weltweit größten Rechenzentren lagen Ende 2002 zwischen 1 PB und 10 PB
  • Im Jahr 1986 war die effektive Kapazität der Welt, (optimal komprimierte) Informationen durch (bidirektionale) Telekommunikationsnetze auszutauschen, 281 Petabyte[2].

Exa und Exbi

Exabyte (EB) (1018 Byte),
Exbibyte (EiB) (260 Byte = 1.152.921.504.606.846.976 Byte)

  • Die Gesamtheit aller gedruckten Werke wird auf 0,2 EB geschätzt
  • Die effektive Kapazität der Welt, Informationen durch (bidirektionale) Telekommunikationsnetze auszutauschen, war 65 (optimal komprimierte) Exabyte im Jahr 2007, und die globale technologische Kapazität Informationen zu speichern betrug geschätzte 295 (optimal komprimierte) Exabyte im Jahr 2007.[2]

Zetta und Zebi

Zettabyte (ZB) (1021 Byte),
Zebibyte (ZiB) (270 Byte = 1.180.591.620.717.411.303.424 Byte)

  • Die weltweite technische Kapazität, Informationen über (unidirektionale) Broadcast- und Rundfunk-Netzwerke zu senden, betrug im Jahr 2007 geschätzte 1,9 (optimal komprimierte) Zettabyte.[2] Dies ist das informationale Äquivalent von 175 Tageszeitungen pro Kopf pro Tag für 2007.[3]

Yotta und Yobi

Yottabyte (YB) (1024 Byte),
Yobibyte (YiB) (280 Byte = 1.208.925.819.614.629.174.706.176 Byte)

  • 1 YB sind etwa so viel Byte, wie Atome in 1,67 Gramm Wasserstoff, entsprechend 0,83 mol H2, vorhanden sind.

Siehe auch

  • Informationsexplosion
  • Vergleich optischer Datenträger: CD, DVD, HD DVD und Blu-ray Disc

Quellen

  1. http://history.nasa.gov/alsj/a11/a11.1201-pa.html
  2. 2,0 2,1 2,2 "The World’s Technological Capacity to Store, Communicate, and Compute Information", Martin Hilbert and Priscila López (2011), Science, 332(6025), 60–65; kostenfreien Zugriff auf den Artikel gibt es über diese Seite: martinhilbert.net/WorldInfoCapacity.html
  3. Video Animation über The World’s Technological Capacity to Store, Communicate, and Compute Information from 1986 to 2010

Weblinks