this post was submitted on 16 Jul 2023
-1 points (33.3% liked)
Brasil - Geral
877 readers
1 users here now
Uma comunidade generalista para o Brasil.
founded 3 years ago
MODERATORS
you are viewing a single comment's thread
view the rest of the comments
view the rest of the comments
Aqui é uma instância específicamente pro português, e essa comunidade especificamente pro Brasil, por isso perguntei. Acredito que pra pelo menos trazer essa discussão para o âmbito brasileiro você poderia editar o post pro português.
Agora a minha opinião do assunto é que já existem alguns projetos como no youtube, mas transcrição automática ainda não é 100% funcional, em particular pra linguas além do inglês ou audios de "baixa qualidade" como eco, ruído, música ou distorções intencionais. Existem problemas muito complexos como por exemplo detectar a linguagem falada (o que só piora com sotaques e dialetos), ou fazer legendas paralelas em caso de pessoas falando ao mesmo tempo. Legendas incorretas podem ser pior que não ter legendas, por exemplo bem simplista, uma agência de notícias falando "O Brasil não irá declarar guerra" e o modelo não transcrever o "não". Então é necessário muito cuidado. Mas cuidado é geralmente uma coisa inexistente na área da computação pela atitude "move fast and break things", então só surgem um monte de protótipos inacabados até algum grupo pequeno fazer algo funcional e ser comprado por uma grande corporação como google.
Ao contrário do que parece a área de IA não está tão desenvolvida assim, principalmente porque o investimento de pesquisa fica pulando de hype em hype toda vez que alguma coisa nova fica famosa entre os investidores leigos. Antes era IA de jogos, depois IA pra música, depois arte e agora texto, sempre sendo abandonado no meio do caminho. Também é importante ressaltar que o sucesso de uma subárea da IA não implica que essa inovação é aplicável em outras subáreas. A área é muito grande, complexa e variada, então um ChatGPT nunca vai dirigir um Tesla, um Tesla nunca vai gerar arte e um Midjourney não consegue recomendar livros.
Obrigada pelo seu tempo, para pessoas com perda auditiva, não é verdade que transcrição não tão exata é pior do que não ter...é o contrário, algumas palavras minimamente contextualizadas já ajudam muito, e junto com a imagem a pessoa já compreende. Se no Youtube já se consegue ter legendas automáticas op pcionais em português , por quê no google Chrome isso não seria possível? O YouTube é do Google não?a AI é do google não?
Me equivoquei na questão do risco e realmente muito do que é dito pode ser entendido a partir do contexto. Alguns problemas mais raros ainda acontecem, por exemplo pessoas com sotaques ou dialetos menos populares na internet naturalmente terão legendas muito piores, como dá pra ver no YouTube comparando alguém do interior do Ceará com um carioca. O maior problema mesmo é que as áreas mais antigas da IA tem estagnado bastante nos ultimos anos e poucos produtos conseguem chegar em etapas finais com confiabilidade alta o suficiente pra o público comum.
O sistema do YouTube é desenvolvido exclusivamente pro YouTube, em código fechado. O Chrome em si é em grande parte baseado no projeto Chromium, que é aberto, então seria muito difícil trazer esse código confidencial da Google pra o projeto. Isso sem contar com o aspecto técnico da implementação que não ficou claro pra mim. Por exemplo, quando você diz o Chrome transcrever áudios você se refere a em que tipo de contexto? Arquivos MP4, streams proprietários como da Netflix, podcasts tanto em MP3 quanto players tipo soundcloud, entre outros, todos tem funcionamento interno muito diferente e o processo de transcrição usando Aprendizagem Profunda é geralmente bem custoso em processamento. Também não ficou claro pra mim se o Chrome que você se refere é o de celular ou PC, que são muito diferentes entre si. O de Android é extremamente limitado e não tem nem suporte a extensões.
O custo técnico de implementar algo assim numa escala universal por padrão no Chrome é tão alto que acho improvável que um dia aconteça. Acho que o primeiro passo é identificar que tipo de arquivo você quer transcrever primeiro e procurar ferramentas que já existem pra isso. No Firefox existem algumas extensões como essas que já fazem o processo, mas tem muitas limitações ainda. Existem também alguns aplicativos e sites como esse que transcrevem seu áudio. Como eu falei ali atrás, o custo computacional é alto então eles geralmente requerem que você crie uma conta para controlar o uso.
Não recomendo esperar que a Google faça nada real em breve para a acessibilidade porque muitas das melhorias deles pra sistemas como tradução e legendas automáticas não foram pra frente desde 5 anos atrás. Mas se você estiver interessado em sistemas além da Google, você pode descrever mais qual o seu caso de uso e a gente pode te ajudar a encontrar alguma combinação de software gratuito que sirva.
Não sou da área da informática, então só consigo dizer que baixei o Chrome beta no windows , e la ativei legendas automáticas, que só t esse m em inglês. Mas para seu comedimento acrescento um programa legal de legendagem, webcaptioner, obrigada pelo seu tempo