ir para conteúdo

Leia-me GARBO API do Google

 

Este script em Perl usa uma API do Google e permite inserir uma URL para realizar Buscas no Google para páginas relacionadas a Palavras-Chave (usando a relação: palavra-chave) ou link a (usando o link: palavra-chave) na URL. Clicando no triângulo ao lado de qualquer dos resultados poderá encontra páginas que são relacionadas ou contém link para esses resultados, e assim por diante. 

Este trabalho é baseado numa idéia que Dave Winer colocou no Scripting News onde havia  implementado uma versão na Radio UserLand. Este script  adiciona algumas características à idéia básica, como descrito abaixo.

Está em HTML, então todos podem compartilhar (bem, muitos podem, de qualquer maneira, veja "DHTML Outline" na seção logo abaixo para conhecimento e compatibilidade entre browser). 

Caso existam mais de 10 resultados retornado para uma dada pesquisa, você pode paginar pelos resultados adentro desse tema utilizando os links de Próximos e Anteriores. Clique no triângulo ao lado de uma listagem  para expandir a listagem. (Note que se você re-expande uma listagem todos os temas sob serão listados; o estado de expansão de sub-tópicos não é guardado em cache.)

Se quer mais flexibilidade para navegar por um determinado jogo de resultados, clique no link do Cachê do Google sob o título da página caso esteja interessados. A mesmo pesquisa abrirá diretamente no Google em uma nova janela do browser.

Campos de Formulários

URL: A URL inicial do site. Atualmente pode ser um nome de domínio, nome de hospedagem, ou mesmo o caminho inteiro até uma página, e não se preocupe incluir ou não o http: // (o link da URL é passada diretamente ao Google sem qualquer modificação exceto adicionando "link:" ou "related:", então os resultados que você verá  — ou deve ser — os mesmos resultados que você veria ao fazer uma procura em diretamente no Google diretamente).

Páginas relacionadas/páginas linkadas: Os botões de rádio permitem selecionar a procura de páginas relacionadas a URL ou para páginas que possuem link para ela.

snippets: Se esta opção é selecionada, cada resultado exibido incluirá um trecho de texto retornado pelo Google.

URLs: Se esta opção é selecionada, cada resultado exibido incluirá uma linha com o URL da página, tamanho, e um link para a versão em cache.

Nota: Se você já fez uma procura e você muda qualquer do acima de cenários, a mudança não aplicará a quaisquer resultados quando você expande a listagem que já é exibida. O cabeçalho "Pagina [ligando/relacionado] a www.foo.com" indica se estão em ligar relacionado modo para o contorno inteiro. Trocar entre ligar relacionado resultados, ou começar URLs de e/ou de pedacinhos de exibição, você deve clicar Procura outra vez e começa do topo.

Chave de Licença do Google.

O Google exige uma chave de licença para ser passado a cada pesquisa. Estas chaves são designadas podem ser adquiridas ao inscreve-se para usar o API de Google, e cada chave atualmente permite 1000 solicitações de pesquisa por dia. Por omissão, estes
scripts usam a chave da brasilmedia.com; mas uma vez que os scripts fazem múltiplas  pesquisas (cada vez que você expande uma listagem ou clica nos links de  Próximo ou Anterior é contada uma consulta), nós este limite seja alcançado rapidamente. Por esta razão, inscreva-se para o programa de API de Google e caso você não se aproxime da cota das 000-pesquisas/dia com o própria chave, nós agradeceríamos se você pudesse utilizar a sua aqui, especialmente se planejar usar estes scripts extensamente. A Brasilmedia não armazenará sua chave de forma alguma. Ela será utilizada somente durante as suas próprias consultas enquanto utilizar estes scripts.

Contorno de DHTML

O scripts GARBO usa uma moldura oculta, JavaScript e DHTML para gerar um layout dinâmico (aviso que o layout interno não re-carrega quando expandido). Atualmente é realizado com o atributo de DHTML innerHTML, que só é suportado por navegadores Internet Explorer 5 ou superior, Mozilla/Netscape 6. Então o scripts só trabalhará com esses browsers.

Provavelmente não seria difícil de implementar uma versão W3C-DOM-compatible como um esboço desta técnica. Se gostaria de tentar, ou ter qualquer outras sugestões outros navegadores, por favor contate-nos (veja embaixo). E caso queira tentar re-codificando o JavaScript (muito não é complicado) você pode fazer download do código fonte e ver o que pode ser feito.

Código Fonte

GARBO tem os seguintes componentes:

* Índice.html:
A página principal, um frameset que chama o scripts de CGI em sua armação mais baixa; se o scripts é chamado no nível superior de uma janela de pesquisador, redirecionará a esta página.

* blank.html:
Uma página vazia que inicialmente é carregada na armação superior oculta. Se fita em ele muito tempo suficiente, permanecerá vazio mas tornar-se-á sedento.

* garbo.cgi:
o script CGI em Perl

* ga_lib. pl:
uma biblioteca de código em Perl com algumas rotinas compartilhado pelos scripts da API do Google

* ga_outlinelib. pl: uma biblioteca de código de Perl com algumas rotinas compartilhado pelos scripts que fazem as funções de DHTML  (atualmente, GAWSH e GARBO)

Por favor sinta-se livre para baixar, ler com atenção o código, e melhorar como seja possível. Os scripts foram codificados apressadamente, então, provavelmente deve existir uma grande possibilidade de melhoramento.

Se desejar pode hospedar uma versão espelhada de qualquer destes scripts no seu próprio servidor, isso seria de grande valia para aprimora-lo. Uma instalação normal do Perl SOAP::Lite e URI::Escape (e uma Chave de Licença da API do Google ) deve ser tudo que você vai precisar.

  • Histórico
    o 4/24/02 - versão 1,0 liberado

    ToDO

    Possíveis melhorias futuras, algum fáceis, outras nem tanto:

    W3C-DOM version of dynamic outlining code
  • Use fragile, touchy CSS instead of sturdy, reliable spacer GIFs to indent outline elements
  • Show ODP page summary and category if present
  • Display Google "search comments" field if returned
  • When a topic is collapsed, save its contents into a variable or hidden element so it can be re-expanded without doing more queries and losing the state of subtopics
  • Topic-by-topic option to switch between related or linking results
  • "Random" link in navigation line, which would jump to a set of search results starting at a random number between 0 and the total result count
  • Reloading the page in some browsers can do weird things. Investigate

Contatos

Email googlescripts [AT] staggernation [DOT] com with questions, comments, bug reports, feature requests, that sort of thing.

All content by Kevin Shay (contact ), and licensed like so except where otherwise specified. Powered by Movable Type

 

API do Google de Busca por Proximidade (GAPS)

 Script em Perl usando API do Google para comparação de dois termos em uma Pesquisa, obedecendo uma certa distância
entre eles dentro de uma página. Realiza esta operação utilizando uma característica raramente discutida no Google.
 

API de Busca por Domínio no Google (GAWSH)

Script em Perl, utilizando API do Google para realizar Buscas à partir de uma palavra-chave para Pesquisa (query string). Retorna uma lista de domínios na web como resultado.