LusoRobótica - Robótica em Português
Discussão Geral => Off-topic => Tópico iniciado por: josecarlos em 10 de Novembro de 2014, 22:09
-
Boas :)
Alguém tem ideia como fazer voz robótica em MONO.
Já fiz em estéreo mas não serve
Gravar de estéreo para mono perde qualidade no processo. >:(
-
Fazer num PC, ou um circuito para meter antes do amplificador e fazer ao vivo?
-
Fazer num PC
Pois o clip de áudio tem de ser MONO.
-
Há vários tutoriais de como fazer uma voz de robot no audacity (o programa de processamento de audio gratuito mais popular) https://www.youtube.com/results?search_query=audacity+robot (https://www.youtube.com/results?search_query=audacity+robot)
Mas se tens um som de robot em stereo que gostas, converter para mono não tem que perder qualidade nenhuma (só se perde a estereofonia). O processo de conversão é que pode não estar a ser o melhor.
No audacity é um processo muito simples: https://www.youtube.com/watch?v=ZJ-Nq-os2YI (https://www.youtube.com/watch?v=ZJ-Nq-os2YI)
-
Estás limitado a uma voz, mas com o espeak, que é open source e há para PC, podes gerar as palavras/frases que quiseres quando quiseres... não é bem uma voz robótica mas também não parece um ser humano normal.
-
Era fácil demais mas tens um problema o chip só aceita mono >:(
Isso já eu fiz com o Audacity ;)
-
Como é que passar de stereo para mono perde qualidade, atiras um canal fora, e usas o outro.
-
Se tiras uma faixa o programa não aceita fazer a voz
Pois ele foi gravado em estéreo
-
Não será antes chip que tem pouca qualidade? Já experimentaste com voz normal e principalmente com musica a ver se ficava bem?
-
Boas :)
O chip é de qualidade, mas ele só aceita mono
O que quero é introduzir no chip a voz robótica em algumas partes das frases para os comandos de voz
A dificuldade é que o Audacity não produz o efeito vocoder em mono
Poderia editar tudo e salvar para outro dispositivo de gravação em mono talvez seja possível ;)
-
Mas afinal de que chip estamos nós a falar?
É que primeiro é o chip que faz a voz, agora quer usar o Audacity para gerar/alterar a voz, isto está um bocado confuso.
-
É um chip de reconhecimento de voz ;)
Penso que me expliquei bem
-
Agora é que complicou lol então o chip não era para reproduzir o som?
-
Como deve saber nenhum chip reproduz voz ou reconhece sem ela estar programada nele
por isso é simples :D
-
Um sinal stereo tem 2 canais, um sinal mono só tem 1. É essa a única diferença entre os dois.
No domínio digital o que afeta a qualidade do audio é a quantidade de bits por sample, e o samplerate.
O que está a dizer que passar de stereo para mono o sinal perder qualidade não faz muito sentido.
O que suspeito que se esteja a passar é que o chip que está usar para reproduzir o audio tem limitações no número de bits por sample ou de samplerate.
Podia partilhar os ficheiros em stereo e em mono para que outros possam ouvir a diferença a que refere, e dizer qual é o chip que está a usar para reproduzir o som? Andar a dar tiros no escuro a tentar acertar na solução é complicado...
-
obrigado, vou tentar resolver ;)
https://www.youtube.com/watch?v=y45zJ9LXYhk&feature=youtu.be (https://www.youtube.com/watch?v=y45zJ9LXYhk&feature=youtu.be)
-
Selecionas um dos canais stereo, delete, feito, está em mono.
Mas caso o help do teu Audacity por alguma razão não faça parte da instalação e o google não esteja a funcionar..
Case 1: Applying a mono modulator to a mono carrier
This means that the modulator (voice) and carrier (music) initially are two separate Audacity mono audio tracks.
If necessary, move the voice track directly above the music track.
In the upper track (voice), open the Track Drop-Down Menu and choose "Make Stereo Track".
Select the stereo track and apply Vocoder with "output choice" set to "both channels". You now have a "dual mono" track where the same content is in left and right channels of the stereo track.
Select the stereo track and choose Tracks > Stereo Track to Mono to make a mono track again.
Fonte:
http://manual.audacityteam.org/o/man/vocoder.html#mm (http://manual.audacityteam.org/o/man/vocoder.html#mm)
Continuo sem entender a duvida, e continua a ser um chip mistério.
-
Tem muitas maneiras de converter uma faixa estereo em mono. Depois de ter o resultado do vídeo, é só ir ao menu "Faixas"->"faixa Estereo para Mono".
Também tem opções no triângulo preto que está nos dados da faixa, onde diz "Faixa de Aú"(dio). Tem lá opção para separar os dois canais de uma faixa estéreo e depois é só apagar um deles.
-
Como deve saber nenhum chip reproduz voz ou reconhece sem ela estar programada nele
por isso é simples :D
Errado, há chips que conseguem sintetizar a voz (acho que é esta a palavra) sem lá estar nenhum som gravado :)
-
Boas :)
Já está resolvido é editar tudo em estéreo depois cortar um canal e exportar para o chip.
jm_araujo e senso tinham a solução, obrigado
Fui pesquisar sintetizador de voz wikipédia e deu isto......... :)
Voz sintetizada pode ser criada concatenando-se pedaços de fala gravada, armazenada num banco de dados. Os sistemas diferem no tamanho das unidades de fala armazenadas; um sistema que armazene fones ou alofones fornecem a maior faixa de saída, mas podem carecer de clareza. Para usos específicos, o armazenamento de palavras ou frases inteiras possibilita uma saída de alta qualidade. Alternativamente, um sintetizador pode incorporar um modelo do trato vocal (caminho percorrido pela voz) e outras características da voz humana, para criar como saída uma voz completamente "sintética".
Isto dava outro livro :)
-
Boas :)
Já está resolvido é editar tudo em estéreo depois cortar um canal e exportar para o chip.
jm_araujo e senso tinham a solução, obrigado
Fui pesquisar sintetizador de voz wikipédia e deu isto......... :)
Voz sintetizada pode ser criada concatenando-se pedaços de fala gravada, armazenada num banco de dados. Os sistemas diferem no tamanho das unidades de fala armazenadas; um sistema que armazene fones ou alofones fornecem a maior faixa de saída, mas podem carecer de clareza. Para usos específicos, o armazenamento de palavras ou frases inteiras possibilita uma saída de alta qualidade. Alternativamente, um sintetizador pode incorporar um modelo do trato vocal (caminho percorrido pela voz) e outras características da voz humana, para criar como saída uma voz completamente "sintética".
Isto dava outro livro :)
Só por uma questão de informação aqui fica a versão original desse artigo http://en.wikipedia.org/wiki/Speech_synthesis (http://en.wikipedia.org/wiki/Speech_synthesis) em que são apresentados alguns métodos que não são baseados em gravações.
-
O espeak que mencionei atrás é um sintetizador de voz (TTS - Texto To Speech). Dá para usar "dinamicamente", mas precisa dum PC (deve correr num RasPI).
c:\> espeak -v portugal -w voz.wav "olá amigos do lusorobótica, sou o zeca e já tenho voz!"
-
Boas :) Njay
Só posso responder agora pois o meu escritório é na rua e não há net 8)
Já estou a editar no Audacity mas também era viável a tua sugestão, obrigado
Tenho uma foto do chip no meu blog e não é só para fazer saudações mas também para fazer algumas tarefas como ligar lâmpadas, tv, etc , vamos ver ;)
www.josecarlosfernandes.blogspot.com (http://www.josecarlosfernandes.blogspot.com)
-
Existem várias tecnologias e algoritmos para a síntese de voz e de fala.
Ainda á dois meses fui ver uma tese de mestrado de um colega que trabalhou sobre este assunto.
Segundo o que percebi o processo tem sempre um "nível de aprendizagem". Depois as diferentes tecnologias/algoritmos processam esses dados à sua maneira. O gps por exemplo junta palavra por palavra. A tese que eu fui ver utilizava fonemas e grafemas(? Não me recordo se era este o nome)
(era um sistema de text and apeaça)
Há chips que conseguem sintetizar som. A fala é obrigatório recorrer à memória.
Até nós o fazemos simplesmente é inerente à nossa existência.
Está contudo em vista começar a utilizar algoritmos para perceber como sintetizar os próprios fonemas. Mas ainda assim apesar de o sistema não ter sons gravados tem uma série de métodos que lhe foram ensinados "programados" para os respectivos fonemas.
-
Sim, é necessária bastante memória e um processador rápido para sintetizar em tempo real.
Existem microcontroladores para o efeito.
Há vários vídeos engraçados de "Songify This" em que alteram o tom de voz para encaixar numa nota certa da pauta, o mesmo é realizado na famosa voz "GLaDOS" (Portal) com o "Melodyne", é bastante desafiante construir um código para o efeito mas a meu ver nada impossível depois de se entender o conceito :) um projecto a longo prazo...
O teu "Alimentador Automático" vai falar?! ;D
-
Está contudo em vista começar a utilizar algoritmos para perceber como sintetizar os próprios fonemas. Mas ainda assim apesar de o sistema não ter sons gravados tem uma série de métodos que lhe foram ensinados "programados" para os respectivos fonemas.
É assim que funciona o eSpeak que mencionei atrás, não é tecnologia nova :) (arrisco até dizer que já vem dos anos 60, mas posso estar enganado, embora não por mais de +10 anos) . Ele gera em tempo real os "formantes" (não sei se é esta a tradução para tuguês) necessários para fazer a voz, que são a mistura de um conjunto de sinusóides de certa frequência/amplitude/fase (e passagem "suave/progressiva" entre 2 formantes); por isso tem uma voz meio artificial, mas é algo que se vai ajustando e melhorando. Há regras para gerar os formantes, para cada lingua.
http://espeak.sourceforge.net/ (http://espeak.sourceforge.net/)
-
Tens o Speak and Spell da TI que é quase dessa altura, finais de anos 70, mas é claro que o desenvolvimento dos ic's usados começou um bocado antes da altura de lançamento, existe alguma informação sobre como ele funciona, mas é basicamente 2 ic's e funciona por fonemas e não palavras pré-gravadas.
Alguma informação relevante sobre o que estou a falar:
http://furrtek.free.fr/index.php?a=speakandspell&ss=4&i=2 (http://furrtek.free.fr/index.php?a=speakandspell&ss=4&i=2)
-
Boas :)
Cá estou eu a fazer a minha caminhada para por o meu ZECA a falar e fazer coisas.
Hoje dei um grande passo já reconhece a minha voz ;D ;D ;D ;D ;D iiiuuuuuupiiiiii
http://youtu.be/-k9926NUu4c (http://youtu.be/-k9926NUu4c)
-
Boas :)
Já tenho uma conversa com o chip, com accionamento de luz ou outros.
A parte de accionamento com módulos rf 433 ainda é uma luz ao fundo do túnel, pois somar duas bibliotecas num só código ainda é um pouco complicado para mim, mas desistir nunca. ;)
Penso que será a ultima barreira deste meu projecto.
Depois meto aqui o video da conversa com accionamento.
-
Olá :)
Penso que a falta de comentários se deve há pouca actividade do forum.
Como prometido aqui fica o video ;)
http://youtu.be/2qklpbVPwuM (http://youtu.be/2qklpbVPwuM)]http://youtu.be/2qklpbVPwuM
Termino por aqui este meu tópico.
obrigado a todos.
www.josecarlosfernandes.blogspot.com (http://www.josecarlosfernandes.blogspot.com)
-
;D ;D
Acho que a conversa é um première neste fórum :)
-
Gosto daquela parte!!!
Aonde encontrar uma albarda para o meu burro? e no fim do tópico tens duas albardas e três burros ..... ;D ;D ;D ;D
-
No curral, claro! Mas se conseguires abrir o velho ferrolho, há para lá umas brochas!
-
Velho ferrolho! tens de te actualizar é mais fechadura electrónica ;)
-
A mandar bocas ó josecarlos ;D