A web semântica — também conhecida como web inteligente, web 3.0 e web de dados — foi proposta pela primeira vez em 2001 pelo criador da World Wide Web, Tim Berners-Lee, em seu artigo The Semantic Web, publicado na Scientific American. O conceito principal é estruturar todo o conteúdo da internet de uma forma semântica, para uma melhor interação humano-computador. Não é necessário o desenvolvimento de novas tecnologias para fazer a web semântica funcionar, mas sim a convergência de tecnologias já existentes. Apesar de o conceito geral envolver inteligência artificial, o objetivo não é treinar e ensinar os computadores a se comportarem como humanos, e sim fazer com que os computadores entendam os conteúdos da internet.
Conceitos e termos
Web 3.0: É importante ressaltar que o termo web 3.0 pode referir-se a duas coisas distintas: a web semântica e a web descentralizada. A web semântica, que é o foco desse texto, propõe o aperfeiçoamento da internet atual com a reestruturação dos conteúdos. Já a web descentralizada, versa sobre criar uma nova internet baseada em blockchain — tecnologia usada por trás das criptomoedas.
Grafo de conhecimento: Na matemática, um grafo é definido por um conjunto de vértices ligados por arestas. Ou, de outra forma, é um conjunto de nós ligados por relações.
Agora, imagine uma empresa que tenha uma planilha no Excel com informações (nome, e-mail, CPF, endereço, estado civil, etc.) sobre seus funcionários. São apenas dados. Olhando para essa planilha, você não consegue determinar as relações entre eles. Quando você define as relações, as informações transformam-se em conhecimento. Além disso, cada nó do grafo pode ser um conhecimento, não necessariamente são dados.
Isso é um grafo de conhecimento. É arranjar uma base de conhecimento e estruturá-la em grafo. Armazenar informações em um grafo de conhecimento responde perguntas que uma simples planilha no Excel ou um banco de dados padrão não responderia. Você pode ter informações individuais sobre Pedro e Maria, mas não tem o conhecimento de que são casados. Isso implica em buscas e filtros mais avançados, por exemplo.
O que é a web semântica?
O conceito fundamental da web semântica baseia-se em um grafo no qual os vértices/nós representam conceitos, e as arestas/relações representam relações semânticas entre os conceitos. É uma internet em que o computador atribui sentido às palavras.
Na internet atual, o mecanismo de busca dos navegadores é baseado em palavras-chave. Não há semântica alguma. Se você faz uma pesquisa em um mecanismo de busca, ele vai isolar as palavras digitadas e procurar conteúdos em que todas — ou quase todas — essas palavras isoladas estão inseridas. No Google Chrome, por exemplo, caso a busca não consiga achar um conteúdo com todas as palavras, ele vai mostrar os conteúdos que possuem a maior parte das palavras-chave que você digitou e destacar a palavra não encontrada.
Na web semântica, o objetivo é interpretar as palavras-chave da pesquisa não apenas como uma sequência de caracteres arbitrários, mas vinculá-las a objetos, pessoas e lugares do mundo real. Hoje, cada empresa tem seu próprio banco de dados, a ideia é implementar uma cultura de dados abertos. O objetivo é conectar dados, e não pessoas.
Implementação
A implementação da web 3.0 vai ocorrer aos poucos e não de um dia para o outro. Da mesma forma, a web 1.0 não se tornou a web 2.0 do dia para a noite. São processos, aplicações e acontecimentos.
O próprio Tim Berners-Lee disse:
O termo web 2.0 é um jargão difícil de explicar e um conjunto de tecnologias com exatamente os mesmos objetivos da web 1.0.
Tim O’Reilley, criador do termo web 2.0, defende que a mesma foi concebida quando as grandes empresas de tecnologia (Amazon, Microsoft, Google e Apple) começaram a prosperar nesse meio, principalmente depois da bolha da internet em 2000, que faliu inúmeras empresas de tecnologia.
Da mesma forma que a web 2.0 foi uma expansão da web 1.0, a web 3.0 vai ser uma expansão da web 2.0. Na verdade, a web semântica já está sendo implementada em algumas aplicações. A cultura da internet vai mudando aos poucos, site por site e aplicação por aplicação.
Exemplo e conclusão
O Google Knowledge Graph é um exemplo disso. Desde 2012, sua rede semântica (contendo cerca de 3,5 bilhões atributos) é usada para compreender o significado das palavras-chave da pesquisa. Ele fornece informações estruturadas e detalhadas sobre o tema, além de uma lista de links para outros sites. O objetivo é prover aos usuários as informações necessárias para responder às suas dúvidas consultadas sem precisarem navegar para outros sites. Você já deve ter visto muitas vezes o Google Knowledge Graph funcionando nas suas buscas. Um exemplo de um Knowledge Graph sobre Thomas Jefferson:
Todas as informações que são mostradas, são conhecimentos que estão armazenados em um grafo de conhecimento utilizando processamento de linguagem natural e aprendizado de máquina para aprimorar as relações.
Essa funcionalidade é apenas um exemplo simples do poder da web semântica. As aplicações que podem ser criadas utilizando esta tecnologia são amplas e promissoras.