diff --git a/archiv/audiowmark/index.html b/archiv/audiowmark/index.html index ad9f380..14b85d3 100644 --- a/archiv/audiowmark/index.html +++ b/archiv/audiowmark/index.html @@ -1,123 +1,126 @@ - - -
Falls du über eine Suchmachine hergekommen bist: Dies ist nur das Begleitmaterial und die -Zusammenfassung zu einem mündlichen Vortrag.
+Falls du über eine Suchmaschine hierhergekommen bist: Dieses Dokument dient nur als +Begleitmaterial und Zusammenfassung eines mündlichen Vortrags
Kommandozeilen-Software von Stefan Westerfeld um Audio-Wasserzeichen in den Audiodaten einer Musikdatei unterzubringen. Eine 128bit Nachricht wird fast unhörbar, direkt in der Wellenform gespeichert und kann wieder ausgelesen werden. Sie kann auch geheim verschlüsselt werden. Der Prozess ist unabhängig vom Dateiformat, Kompression und Wiedergabeart, also Datei, Streaming etc. Man braucht die originale Datei nicht um die Nachricht auszulesen. -
"Ticking all the boxes" für Open Source Software: GPL, Verschlüsselungsmethode bekannt und einsehbar, basiert nur auf einem private key (oder unverschlüsselt). -
Hier geht es nur um die reine Anwendung, nicht um die technischen Hintergründe. -
Die Einsatzmöglichkeitne stehen noch weiter unten, aber hier schonmal der Zweck vorweg: Hauptsächlich DRM und Authentifizierung. Man kann individuelle Informationen (etwa Kundennummern) in der Audiodaten selbst speichern, ohne dass diese erkennbar und entfernbar sind, so zumindest das implizite Versprechen des Autors. +
Kommandozeilen-Software von Stefan Westerfeld, entwickelt zum Einbetten von Audio-Wasserzeichen +in die Audiodaten einer Musikdatei. Eine 128-Bit-Nachricht wird fast unhörbar und direkt in der +Wellenform gespeichert und kann auch wieder ausgelesen werden. Zudem besteht die Möglichkeit, sie geheim zu verschlüsseln. + Der Prozess ist unabhängig vom Dateiformat, der Kompression und der Wiedergabeart, also +Datei, Streaming usw. Zum Auslesen der Nachricht ist die Originaldatei nicht erforderlich.
+ +"Ticking all the boxes" für Open-Source-Software: GPL, Verschlüsselungsmethode ist bekannt und +einsehbar, basiert nur auf einem privaten Schlüssel (oder unverschlüsselt).
+ +Hier geht es nur um die praktische Anwendung, nicht um die technischen Hintergründe.
+ +Die Einsatzmöglichkeiten werden weiter unten erläutert, aber vorab der Hauptzweck: primär DRM +und Authentifizierung. Man kann individuelle Informationen (z.B. Kundennummern) in den Audiodaten +selbst speichern, ohne dass sie erkennbar und entfernbar sind, so zumindest das implizite +Versprechen des Autors.
-Es gibt auch 'videowmark', ein ähnliches Tool für Videos, das hier jedoch nicht behandelt wird.
-Wo bekommt man den her? +
Woher bekommt man diesen?
-Als Hash. Die ersten 128bits eines SHA-256 Hash (Kurze Nachfrage: Wissen alle, was ein Hash ist? Wissen alle was Hex 0-9A-F ist?) -
+Als Hash. Die ersten 128 Bits eines SHA-256-Hashes (Kurze Frage: Wissen alle, was ein Hash ist? Wissen alle, was Hex 0-9A-F bedeutet?)
+echo -n "OSAMC:BlackStorm:Download312" | sha256sum | head -c 32 b751e47bb131d84e6b67a3348c781d43 -#head -c 32 weil es hex ist: ein Hexwert ist 4bit. Also 128bit / 4bit = 32 chars -#audiowmark empfiehlt eine Datenbank anzulegen, da man hash werte nicht zurückentwickeln kann +# head -c 32, weil es Hex ist: ein Hexwert ist 4 Bit. Also 128 Bit / 4 Bit = 32 Zeichen +# Audiowmark empfiehlt eine Datenbank anzulegen, da man Hashwerte nicht zurückentwickeln kann-Oder 16 ASCII-Zeichen in Hexadezimaler Schreibweise: -
+Oder 16 ASCII-Zeichen in Hexadezimaler Schreibweise:
+echo -n "osamc:blkstm:312" | xxd -p -u 6F73616D633A626C6B73746D3A333132 -#Rückgängig: echo -n "6F73616D633A626C6B73746D3A333132" | xxd -p -r +# Rückgängig machen: echo -n "6F73616D633A626C6B73746D3A333132" | xxd -p -r-Eine UUID, die sind zufällig auch 128bit lang. -
-uuidgen | tr -d - -#76fc5abe80f840729375fc4dc15e604d +ine UUID, die zufälligerweise ebenfalls 128 Bit lang ist.
++uuidgen | tr -d '-' +# 76fc5abe80f840729375fc4dc15e604d-Oder 32 Zeichen, die "zufällig" alles Hexwert 0-9A-F sind, aber bereits semantisch lesbar sind. -
+Oder 32 Zeichen, die zufällig alle Hexwerte 0-9A-F sind, aber bereits semantisch lesbar:
+affe2222fefe1111affe2222fefe1111-Wenn man am Ende schnell einen ausgelesenen String mit seinem eigenen vergleichen möchte: -
-[ "affe2222fefe1111affe2222fefe1111" = "affe2222fefe1111affe2222fefe1111" ]; echo $? #Ergebnis 0 heisst gleicher String. +Um einen ausgelesenen String schnell mit dem eigenen zu vergleichen:
++[ "affe2222fefe1111affe2222fefe1111" = "affe2222fefe1111affe2222fefe1111" ]; echo $? # Ergebnis 0 bedeutet, dass es der gleiche String ist.-Beispiel 1: Unverschlüsselt in einer wav Datei
+Beispiel 1: Unverschlüsselt in einer WAV-Datei
-+Das Hinzufügen und Auslesen eines Wasserzeichens in einer unverschlüsselten WAV-Datei:
+audiowmark add blackstorm.wav wm-blackstorm.wav b751e47bb131d84e6b67a3348c781d43 audiowmark get blackstorm.wav -#leer +# Leer audiowmark get wm-blackstorm.wav-"get" entnimmt die Nachricht wieder aus der Audiodatei. -Das finden einer Nachricht, obwohl keine vorhanden ist (oder eine falsche Nachricht) kann zwar passieren, muss aber auch schließlich zu deiner privaten, geheimen Datenbank passen. Das, so die Entwickler, ist selten genug um es statistisch auszuschließen. +
Der Befehl "get" extrahiert die Nachricht aus der Audiodatei. Das Auffinden einer Nachricht, +obwohl keine vorhanden ist (oder eine falsche Nachricht), ist möglich, muss aber zu Ihrer privaten, +geheimen Datenbank passen. Laut den Entwicklern ist dies selten genug, um statistisch +vernachlässigbar zu sein.
+
+audiowmark get --detect-speed-patient wm-blackstorm.wav-Man bekommt mehrere Nachrichten zurück. Das ist Redundanz gegen Korruption und Kompression. -
Das 3. Feld ist der "Sync Score", je höher desto besser. Das 4. Feld ist "Decoding Error", niedriger ist besser. -Danach Block-Type. A allein ist ok, AB ist besser. -
Am Ende kommt ein "All" als Zusammenfassung. Das kann man dann mit einem anderen Programm parsen. z.B. das in eine Datenbank reinpipen. +
Es werden mehrere Nachrichten zurückgegeben, als Redundanz gegen Korruption und Kompression. Das dritte Feld ist der "Sync Score", je höher, desto besser. Das vierte Feld ist "Decoding Error", niedriger ist besser. Danach folgt der Blocktyp. Allein A ist in Ordnung, AB ist besser.
+Am Ende erscheint ein "All" als Zusammenfassung, die man mit einem anderen Programm verarbeiten kann, z.B. in eine Datenbank einpflegen.
Beispiel 2: Verschlüsselung
-Um zu verhindern, dass jeder mit audiowmark die Nachricht auslesen kann, bzw. verhindern kann, dass -überhaupt festgestellt werden kann, dass ein Wasserzeichen vorhanden ist, wird eine interne Verschlüsselungsmethode bereitgestellt. -Wie sicher das ist, wurde nicht überprüft. - -
-audiowmark gen-key osamc-music-distributor.key #speichert in einer Datei -#key 88913063e57c946b37bf6ea8ce842d32 +Um zu verhindern, dass jeder mit Audiowmark die Nachricht auslesen kann bzw. um zu verhindern, dass festgestellt werden kann, ob ein Wasserzeichen vorhanden ist, wird eine interne Verschlüsselungsmethode bereitgestellt. Die Sicherheit dieser Methode wurde nicht überprüft.
++audiowark gen-key osamc-music-distributor.key # Speichert den Schlüssel in einer Datei +# Schlüssel 88913063e57c946b37bf6ea8ce842d32 audiowmark add --key osamc-music-distributor.key blackstorm.wav wmk-blackstorm.wav b751e47bb131d84e6b67a3348c781d43 -audiowmark get --detect-speed-patient wmk-blackstorm.wav -#leer +audiowark get --detect-speed-patient wmk-blackstorm.wav +# Leer audiowmark get --detect-speed-patient --key osamc-music-distributor.key wmk-blackstorm.wavBeispiel 3: Kompression
-+Das Wasserzeichen bleibt auch nach der Kompression der Audiodatei erhalten:
+opusenc wmk-blackstorm.wav wmk-blackstorm.opus sox wmk-blackstorm.wav wmk-blackstorm.mp3 @@ -125,48 +128,45 @@ audiowmark get --detect-speed-patient --key osamc-music-distributor.key wmk-blac audiowmark get --detect-speed-patient --key osamc-music-distributor.key wmk-blackstorm.opus- -Beispiel 4: Analog als Stream mit Pipes
-"Worst case": Verschlüsselte mp3 version über die Handy-Lautsprecher abspielen und mit internen Laptopmikrofon aufnehmen. +
"Worst case": Eine verschlüsselte MP3-Version wird über Handy-Lautsprecher abgespielt und mit einem internen Laptopmikrofon aufgenommen.
-Eigentlich wollte ich das mit dem eigenbaute Stream machen, aber das habe ich nicht hinbekommen, mit den input optionen. (--input-format raw). -jack_capture sollte gehen, aber das ging mit meinem Pipewire nicht. Also Audacity… -Weil es analog war benutzen wir --detect-speed. +Eigentlich war geplant, dies mit einem selbstgebauten Stream zu tun, aber es gab Probleme mit den Eingabeoptionen (--input-format raw). Jack_capture sollte funktionieren, aber es gab Probleme mit meinem Pipewire-Setup. Also wurde Audacity verwendet...
+ +Da es sich um eine analoge Übertragung handelt, wird --detect-speed verwendet.
Weitere Experiment-Ideen
Ist das Wasserzeichen hörbar bzw. beeinträchtigt es die Audioqualität?
-Ist das Wasserzeichen hörbar, bzw. wird dadurch die Audioqualität schlechter? +
Hier können nur subjektive Eindrücke eine Antwort geben. Die README behauptet, dass die Qualität nicht beeinträchtigt wird, aber das ist nicht sicher. In diesem Beispielstück war zumindest nichts direkt hörbar. Es könnte jedoch sinnvoll sein, dies an einer reinen Sinuswelle zu testen.
-Hier können nur subjektive Eindrücke antworten geben. Die README sagt, das wäre schon alles gut so, -aber wer weiß... -Ich hab zumindest in diesem Beispiellied nichts direkt gehört. Aber das ist auch nur ein Stück. Vielleicht müsste man mal eine reine Sinuswelle testen. - -
-Es ist auf jeden Fall möglich, seine Musikqualität zu verschlechern. So gibt es z.B. -einen --strength flag der mit Werten über 10 (standard) schlechter wird. -Je höher die "strength" desto robuster gegen Audio-Kompression. 10 reiche für 128kbit mp3. -Man muss für das setzen und auslesen der Nachricht den gleichen strength-Wert benutzen, -muss sich diesen also merken. +
Es ist definitiv möglich, die Musikqualität zu verschlechtern. So gibt es z.B. einen --strength-Flag, der mit Werten über 10 (Standard) zu schlechterer Qualität führt. Je höher die "strength", desto robuster gegen Audio-Kompression. 10 reicht für 128 kbit/s MP3. Für das Setzen und Auslesen der Nachricht muss derselbe strength-Wert verwendet werden, dieser sollte also notiert werden.
Frage ans Plenum: Wofür ist das nützlich, außer als technisches Kuriosum? Gibt es Anforderungen, -die nicht besser durch ein explizites paralleles Signal abgedeckt werden können (siehe Metadaten und Verkehrsinfo fürs Autoradio) +
Frage ans Publikum: Wofür könnte dies nützlich sein, abgesehen von einem technischen Kuriosum? Gibt es Anforderungen, die nicht besser durch ein explizites paralleles Signal abgedeckt werden könnten (siehe Metadaten und Verkehrsinfo für Autoradios)?
Sollte man es also benutzen oder nicht? Pro/Contra… +
Sollte man es also verwenden oder nicht? Hier sind Pro und Contra...
+ +Experimente: -* In ein Video einbetten und auf youtube hochladen. Dann das ganze mit youtube-dl runterladen und schauen. -* Über Lautsprecher abspielen und sich das anhören: Raum und/oder Handy-Lautsprecher und Laptop-Mikrofon +