Top

HIDE

Snippets NO!

FALSE

Pagine

YouTube ed i possibili FALSI ERRORI di TRASCRIZIONE dei testi.

Quando facevo attività di Moderazione online, in certi software era possibile inserire delle LISTE di parole che potevano essere ...


Quando facevo attività di Moderazione online, in certi software era possibile inserire delle LISTE di parole che potevano essere BLOCCATE. Se un utente scriveva una parolaccia o faceva SPAM in un Forum in una Bacheca Online, io inserivo la parolaccia o una parola relativa allo SPAM, tipo Viagra, Casinò Online, e cose simili per fare in modo che il programma bloccasse la pubblicazione tutti i messaggi futuri contenenti quelle parole, oppure addirittura bloccasse l'utente che aveva provato ad inserire quei messaggi.

Il problema poteva non essere solo quello delle parolacce. Dei programmatori senza etica e morale per guadagnare avevano sviluppato dei software che trovassero dei: 

  • Canali, 
  • Chat, 
  • Gruppi, 
  • Bacheche di messaggi online, 
  • Articoli con strumenti di commento da parte degli utenti, 
  • Forum aperti,
  • Form online di invio email, 

per inviare SPAM di ogni tipo.

Gli stessi Canali qui su Telegram furono in una prima fase soggetti a questi attacchi. Quindi l'attività di Moderazione, di FILTRO, di BLOCCO (Ban) esiste dall'inizio di Internet a mia memoria. Una volta era una attività umana, manuale di individuazione di testi indesiderati e inserimento in una lista di FILTRO. 

Oggi i grandi BIG del web sicuramente hanno una gestione mista fatta di Moderatori "Umani" e strumenti di Intelligenza Artificiale che auto apprende.

YouTUBE, il più grande Media di Video al Mondo, la prima "televisione" online, il secondo motore di ricerca al mondo, e tra i primi in termini di fatturato pubblicitario, ha uno strumento di Trascrizione Audio del PARLATO, associato ad un sistema di Intelligenza Artificiale più evoluti sul pianeta terra. 

Questo strumento si è evoluto anche e sopra tutto grazie alle migliaia o centinaia di migliaia di correzioni fatte dagli  utenti, cioè gli Youtuber o creatori di contenuti come vengono chiamati oggi. L'interesse di molti Youtuber è quella di allargare il numero di visualizzatori e pertanto spesso inseriscono la trascrizione integrale del parlato di un video. O meglio ancor più spesso correggono quella automatica fatta dal software di riconoscimento vocale di YouTube che è associato ad una intelligenza artificiale che IMPARA, APPRENDE, sopra tutto DALLE CORREZIONI.

Migliaia di Youtuber che producono centinaia di video all'anno. Ogni video ha migliaia di parole. Ogni trascrizione corretta riceve correzioni che sommandosi per il software di riconoscimento vocale di YouTube vogliono dire probabilmente qualcosa nell'ordine delle centinaia di migliaia se non milioni di correzioni avvenute negli ultimi anni.

Ogni tanto faccio delle trascrizioni di video e lo posto nel sito, perché ritengo importante salvarne il CONTENUTO, il senso e significato delle parole nel contesto storico, nel caso in cui quei video venissero cancellati o dalla piattaforma o da chi li ha postati.

E quello che noto sono le CORREZIONI ricorrenti che mi trovo a fare. E NON POSSO CREDERE sapendo in termini di "analisi" come funzionano questi sistemi, che certi ERRORI siano ancora sempre presenti. 

Una di queste parole che mi trovo sempre a correggere è la parola COVID. 

Giusto oggi stavo trascrivendo un video del 2021, e la trascrizione automatica della parola COVID detta più volte nel video era sempre sbagliata. Perché?

Sicuramente il software di YouTube durante il 2020 ha  ricevuto migliaia di correzioni di trascrizione della parola COVID. E l'ho trovata sbagliata anche quando era ben scandita, senza rumore d'ambiente. 

"A pensare male si fa peccato ma quanto ci si azzecca" così recita il detto. 

Personalmente ritengo che ci possa essere una lista di parole inserite da "Moderatori" che il software di trascrizione vocale di YouTube in certi periodi storici deve trascrivere in modo errato. Perché? 

I motivi possono essere molteplici. Ma il più importante a mio avviso è perché il testo è INDICIZZABILE E TRADUCIBILE con strumenti diversi, non solo quelli di Google. 

Altri motori di ricerca possono visitare YouTube, scandagliare le trascrizioni che si trovano nell'ultimo menu sotto ai video, quello con tre puntini " ... " ed ha come sotto voci di menù, Segnala, Mostra trascrizione. E facendo software, secondo me non è un caso che Mostra trascrizione sia sotto a Segnala. 

In ogni caso non mi meraviglierei nemmeno un po' se dopo "ordini" calati dall'alto, magari dall'Agicom, quindi dal Governo, o da una delle Aziende azionista di maggioranza di YouTube o controllate da Alfabet (cioè da Google), certe parole vengono inserite in LISTE DI MODERAZIONE AUTOMATICA per essere censurate.

Nessun commento