Kerminy HackSpace

Outils du site


ateliers:freak

FREAK

Inter-communication asynchrone par passerelle radioCB/sous-titrée , voix+traduction machine.

Suite à experimentations_poetiques vient la construction de(s) FREAK, partie de réseaux monstrueux.
La communication est monstrueuse vue du coté de la machine, où ici la voix humaine est sous titrée en langue compréhensible par la machine.
On respecte ainsi la règle (ancienne depuis une non-interdiction de transmission de donnée en canaux CB étendus) en superposant au canal vocal une deuxième voix musicale de codes sonores, l'ensemble est une transmission vocale.

Mais cette parole est de fait une voix synthétique…

Le réseau FREAK prévoit aussi d'autres moyens de transmissions, postier à pieds ou en vélo, noria numérique, etc.

Il y aura donc dans un même canal de 10KHz 2 parties, sachant que cette répartition est à expérimenter:

  1. la partie basse? pour un sous titrage MFSK? littéral de la voix à destination de la machine/passerelle réceptrice
  2. la partie haute? (sur 5KHz) de la voix, évidement filtrée pour tenir dedans

Le tout restant audible et compréhensible, le chant en basses peut êtres filtré naturellement par l'oreille pour n'écouter que le discourt.

Les deux parties sont synchronisées, la prosodie et le débit des notes sont superposables pour constituer un discours sous-titré par du son.

Fabrication de la partie vocale

On utilisera une synthèse vocale pour fabriquer un fichier son synchronisable et traduisible en notation sonore. Le sous-titrage sonore se faisant sur le fichier de phonème, plus compact que l'original textuel. Mais nous tenterons de transmettre aussi directement le texte plus tard.

La synthèse vocale MBROLA

Le fameux MBROLA (libre depuis 2019!)

permet de fabriquer des fichiers de phonèmes:

espeak-ng -v mb/mb-fr4 "Bonjour les copains!" --pho  --phonout=bonjour.pho

fichier phonème qui permet la synthèse vocale vers un fichier son (jouable par ex avec aplay)

mbrola fr1/fr1 ./bonjour.pho /tmp/bonjour.wav

Le fichier de phonème peut être modifier pour corriger ou transformer la diction, la rendre plus ou moins rapide, choisir d'autres voix etc.

Fabrication de la partie sous-titrage sonore

À partir du fichier de phonème,

awk '{ printf("%s",$1) }' fichier.pho

On associe un son a chaque phonème ou on utilise une procédure MPSK,DominoEX,RTTY ? …

Peut être faisable avec Puredata

On en est lala…⇐==

Collage des deux parties

Il faut mixer le fichier MPSK? au fichier voix en filtrant celui-ci pour tenir dans les 5Khz (voir 4KHz) du haut de la fréquence.

La voix s'entendrait très aiguë et rapide

Il faudra trouver …

Transmission

Le temps de transmission ne devrait pas dépasser un temps à définir … 30 secondes max.?

On peut utiliser une entête (identification/destinataire) et une fin “terminé”, pour permettre une réutilisation correcte des messages. Il faut aussi la coder, PACTOR? autre ?

  1. Il faut commencer par faire une écoute du canal commun ou d'un canal défini
  2. si il n'y a pas d'occupation pendant 10s? alors on peut transmettre

Réception

  1. écoute , attendre l'évènement entête connue
  2. enregistrer le son jusqu'à fin, max 30sec?
  3. découper en 3 parties
    1. entête de traitement, origine/destinataire ⇒ routage vers la bonne application, mail/msg, autre
    2. fichier de phonème ⇒ traitement en tant que texte, mail/msg etc
    3. fichier voix pour une écoute, comme une piece jointe du message.

les instructions de traitement peuvent aussi faire parties du message, comme :“De: Jeff à PYC; Sujet: guitare pour samedi;msg: Penses à prendre la guitare blanche pour samedi , on y collera un piezo <EOF> ? vers un protocole de messagerie connu SMTP, XMPP , un échange MQTT ou même un flux RSS ou ATOM??

ailleurs * https://www.cnx-software.com/2023/07/08/quansheng-uv-k5-multiband-radio-gets-experimental-firmware-to-work-in-the-18mhz-1300-mhz-bands/

ateliers/freak.txt · Dernière modification : 2024/02/08 17:20 de 127.0.0.1