Converse com as máquinas

Publicado em: 14/12/2010

Ethevaldo Siqueira

A comunicação homem-máquina evoluiu de forma surpreendente na era digital: de botões a teclado, controle remoto, identificação por meios biométricos (como impressões digitais, íris, timbre de voz, fisionomia, gestos, movimentos), síntese e comando vocal. Essa é a trajetória da comunicação homem-máquina. Ou, na linguagem dos especialistas, da interface de usuários. Vivemos hoje uma época de humanização das interfaces. Elas nos permitem uma comunicação muito mais fácil e intuitiva com as máquinas. Como um conjunto de meios – hardware e software – que nos permite estabelecer relação com as máquinas, elas tendem a tornar-se cada vez mais amigáveis, humanizadas e intuitivas.

Há muitos exemplos dessa tendência. As modernas telas de toque (touchscreens) criam uma relação muito mais intuitiva e amigável entre usuários e smartphones (como iPhone, Xperia ou Galaxy) ou outros dispositivos portáteis (como iPods, iPads, tablets, notebooks e laptops).

Comandos por gestos

A Toshiba japonesa tem um modelo de televisor que pode ser operado apenas com movimentos das mãos e dos braços, feitos à distância de até 4 metros diante do aparelho. Os gestos são detectados por minúsculas câmeras de vídeo embutidas nesse equipamento. É um tipo de comando quase mágico, executado por movimentos (Spatial Motion Interface).

Essa interface é também usada em videogames. Em lugar de usar o tradicional joystick ou controle remoto, o usuário apenas faz movimentos com a mão e com o braço para comandar o seu videogame. Ou, diante do televisor, para selecionar canais, acessar a internet, organizar arquivos e fotos ou editar apresentações audiovisuais. Em breve, a interface de gestos ou movimentos será utilizada também por muitos outros equipamentos, como home theaters, consoles de videogames, sistemas de áudio e vídeo ou softwares aplicativos.

Na casa digital, passaremos a usar formas avançadas de identificação biométrica, pela voz, impressões digitais, íris ou fisionomia, em incontáveis situações, para o controle de seus equipamentos e sistemas.

Por ser o mais próximo da comunicação humana, mais intuitivo e natural, o comando de voz deverá ser a interface preferida das pessoas no futuro, em especial se considerarmos os avanços da síntese da voz (voice synthesizing) combinada com o reconhecimento da fala (speech recognition), que nos permitem estabelecer o diálogo homem-máquina.

Na prática, porém, a maioria das pessoas ainda parece resistir a esse diálogo. Ouvi de um jovem uma frase que resume a questão com precisão: “Sinto-me um débil mental, conversando com as máquinas”.

Como usuário, tenho ainda muitas queixas em relação às interfaces pouco amigáveis que encontramos em dezenas de aparelhos eletrônicos ou dispositivos do mundo digital, embora devamos reconhecer o avanço expressivo já obtido e incorporado pela maioria dos equipamentos eletrônicos nos últimos anos.

Interface gráfica

Nos computadores pessoais, a interface gráfica de usuário (Graphic User’s Interface ou GUI) é a mais largamente conhecida e a que tornou realmente fácil e amigável o uso de todos os aplicativos e programas dessas máquinas. A interface gráfica teve papel relevante na popularização da maioria dos softwares de PCs ao longo dos anos 1980 e 1990.

Pouca gente se lembra, quando usa esses comandos gráficos com um mouse nos computadores pessoais, que ela foi adotada primeiramente pelos computadores Lisa e Macintosh da Apple e, bem depois, pelos PCs, com os sistemas operacionais Windows, da Microsoft. Mas é preciso lembrar, também, que não foi a Apple que criou nem o mouse nem a interface gráfica de usuário dos computadores Lisa e Macintosh. Seus criadores foram Alan Kay e Douglas Engelbart, pesquisadores do laboratório de pesquisas da Xerox, o Palo Alto Research Center (Parc).

Há pelo menos 30 anos, a indústria tenta introduzir, sem grande sucesso, as interfaces de voz ou, no jargão dos especialistas, as linguagens de alto nível, mais próximas da linguagem humana. Nos primeiros anos, a razão principal desse insucesso podia ser atribuída à baixa qualidade dos softwares de voz sintética e de reconhecimento da fala.

O curioso é que, mesmo com a evolução extraordinária dessa tecnologia, a maioria das pessoas não se entusiasma por esse tipo de interface, pelo menos se houver alternativas convencionais, como o velho teclado, aos quais estamos acostumados há tanto tempo. A experiência dos celulares com comando de voz é uma prova disso. Poucos a utilizam.

Biometria

O uso de características do próprio corpo humano – impressões digitais, a palma da mão, a íris, a fisionomia ou a voz –, embora desperte curiosidade como forma avançada de interface, encontra também resistência por parte de muitos usuários.

Uma voz rouca por resfriado acaba, às vezes, impedindo a abertura de uma porta ou o reconhecimento de um usuário. Pequenas alterações da fisionomia, resultantes do envelhecimento do usuário, por exemplo, podem inviabilizar seu reconhecimento pela máquina ou sistema de segurança.

Pelo que vemos, nem todo esforço de humanização e de simplificação é aceito pelo usuário. O leitor conhece dezenas de pessoas que preferem o câmbio manual dos automóveis e não se entusiasmam pelo câmbio automático. Mas essa preferência pelo manual está caindo rapidamente, porque a tecnologia oferece soluções cada dia mais perfeitas, com economia de combustível e maior segurança.

Diálogo máquina-máquina

Quando você passa pelo pedágio automático do tipo Sem Parar, um dispositivo de seu automóvel comunica-se com o equipamento eletrônico da cancela e fornece seus dados para debitar em sua conta o valor do pedágio, usando a tecnologia dos Dispositivos de Identificação por Radiofrequencia, ou RFID (sigla em inglês Radio Frequency Identification Device). Outro exemplo: seu celular comunica-se permanentemente com a estação radiobase, informando onde ele está a um sistema de controle central da operadora.

No futuro, bilhões de dispositivos à nossa volta estarão em permanente comunicação, para controlar o trânsito das ruas, para supervisionar a segurança de prédios, empresas e residências e para outras mil aplicações. Serão, em sua maioria, microprocessadores (chips) minúsculos embutidos nas paredes, nas portas, nas roupas das pessoas, na coleira dos cães, nos relógios e celulares de estudantes e nos sistemas de vigilância que tendem a multiplicar-se dia a dia.

A função predominante desses dispositivos será proteger-nos. Mas nada nos convence de que não poderão ocorrer abusos e novas formas de violação de nossa privacidade. Nesse caso, estaremos diante da desumanização das interfaces.

1 responder
  1. Evandro says:

    Gostei muito do seu texto. Sou um entusiasta em tecnologia, e isso me atrai bastante. Por exemplo, cheguei neste teu texto pois busco no momento por aplicativos ou formas de como programar para que meu computador me “entenda” por voz. Existem já aplicativos capazes de fazer o que quero, mas agora estou escolhendo por qual usarei e me dará suporte posteriormente.
    Em um momento vc comenta sobre a fala de alguém que ainda não resiste a interagir com a máquina. A partir do momento que for acessível a tecnologia, essas barreiras serão quebradas. A partir do momento que eu nao precisar mais digitar este texto para explicar minha opinião sobre o assunto, e eu economizar tempo com isso ditando minha opinião para o computador, essa tecnologia será aceita por todos.
    As formas de interação máquina/homem evoluem, e a interação por voz será o grande salto da tecnologia. A partir deste momento não haverá muito o que evoluir, a máquina já será tão rápida em executar nossos comandos que a utilidade do método completa tudo o que precisaremos.
    Da mesma forma que a Apple nos mostrou o quanto é simples ler um livro e folheá-lo em seu iPod/iPad/iPhone, chegará o momento em que alguma grande empresa do setor nos mostre o quando é simples ditar a sua opinião em algum fórum da internet, ou executar alguma operação computacional, ou responder para você as tarefas marcadas em sua agenda eletrônica após sua pergunta ao computador.
    Não que você estará sendo “um idiota por conversar com o computador”, mas sim porque para o ser humano é muito importante mostrar para todos que sabe mandar, e o outro obedece. Neste caso, quem paga o pato de ser “pau-mandado” é o computador!

Deixe uma resposta

Gostaria de deixar um comentário?
Contribua!

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *