1 votes

Comment la fonction Speech-to-text de l'enregistreur vocal de Samsung stocke-t-elle le texte et le synchronise avec l'audio ?

J'utilise le Samsung Galaxy S7 et récemment, j'ai utilisé la fonction de synthèse vocale dans l'application d'enregistrement vocal par défaut. Lorsque je lis l'un des fichiers audio qui a été enregistré avec cette fonction, l'application est capable d'afficher le texte en synchronisation avec l'audio. J'ai vu que le texte était stocké dans un autre fichier texte avec le fichier audio, mais il ne s'agissait que du texte brut. J'essaie de comprendre comment cela fonctionne.

Ces informations permettent-elles de synchroniser le texte et le son stockés dans le fichier audio ? Dans ce cas, tous les enregistrements sont uniquement en fichiers M4A. J'ai donc essayé de chercher ce que les fichiers M4A peuvent stocker, par exemple s'ils peuvent stocker des sous-titres, car il semblerait que ce soit les sous-titres qui permettent cette synchronisation. Cependant, je n'ai pas trouvé d'informations à ce sujet. Il est également possible que l'application stocke ces informations dans une sorte de stockage ou de cache, ce qui signifie que si je transfère les fichiers sur mon ordinateur, aucun texte ne sera synchronisé avec l'audio.

2voto

Alex Zylman Points 511

Je pense avoir trouvé la réponse en cherchant dans les fichiers M4A eux-mêmes. Le texte et les horodatages, si je ne me trompe pas, sont stockés dans les fichiers M4A.

J'ai examiné les données binaires du fichier à l'aide d'un éditeur hexadécimal et de l'application normale Notepad de Windows. J'ai trouvé tout le texte dans un emplacement et il semble que Java ait été utilisé. Je suppose qu'il s'agit uniquement d'une fonctionnalité conçue spécialement pour l'application Samsung Voice Recorder.

Un échantillon est présenté ici (avec certaines parties et la plupart des caractères bizarres supprimés) :

;com.sec.android.app.voicenote.common.util.VoiceRecorderData 
mCategoryNamet Ljava/lang/String;L mEffectNameq ~  java.util.ArrayListx sizexp 2com.sec.android.app.voicenote.common.util.TextData ConfidenceScoreI dataTypeJ durationJ elapsedTimeJ   timeStamp[ mTextt [Ljava/lang/String; [Ljava.lang.String;{
t The pppppppppsq ~ 
t 
recording pppppppppsq ~ 
t to pppppppppsq ~

androidalle.com

AndroidAlle est une communauté de androiders où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres sysadmins, poser vos propres questions ou résoudre celles des autres.

Powered by:

X