próximo acima anterior sumário índice
Próximo: 25. C News Acima: 24. Notícias na Internet Anterior: 24.2 O Que é   Sumário   Índice


24.3 Como a Usenet Lida com Notícias?

Atualmente a Usenet cresceu em proporções enormes. Sites que carregam todas as notícias normalmente transferem algo como centenas de megabytes por dia. Obviamente isso requer muito mais que transferir alguns arquivos. Vamos então verificar como a maioria dos sistemas lida com notícias da Usenet.

Notícias são distribuídas através da Internet por vários transportes. O meio historicamente mais comum usado é o UUCP, porém atualmente o tráfego principal é realizado através dos sites Internet. O algoritmo usado é chamado alimentador: cada site contém um número de conexões (alimentadoras de notícias) para outros sites. Qualquer artigo gerado ou recebido pelo sistema de notícias local é reenviado para eles, a menos que o artigo já tenha sido visto naquele site, sendo descartado nestes casos. Um site pode reconhecer outros sites onde o artigo já tenha sido visto através do campo de cabeçalho Path:. Este cabeçalho contém uma lista de todos os sistemas pelos quais o artigo foi reenviado através de uma notação no formato ``bang'' (separados por !).

Para distinguir artigos, reconhecendo aqueles que estejam duplicados, os artigos Usenet tem uma identificação de mensagem (especificada no campo de cabeçalho denominado Message-Id:, a qual combina o nome do site de postagem e um número serial no formato ``''. Para cada artigo processado, o sistema de notícias registra o fato em um arquivo de histórico, o qual é utilizado na verificação de novas mensagens que chegam ao site.

O fluxo entre quaisquer dois sites pode ser limitado por dois critérios: no primeiro o artigo é assinalado como pertencente à uma distribuição (através do campo de cabeçalho Distribution:, o qual pode ser usado para confinar a mensagem a um certo grupo de sites. No segundo caso os grupos de notícias trocados podem ser limitados pelos sistemas remetentes, destinatários ou ambos. Uma definição do conjunto de grupos de notícias e distribuições permitidas para transmissão para um determinado site é normalmente mantida no arquivo sys.

Um número crescente de notícias normalmente requer que melhorias sejam implementadas neste esquema. Em redes UUCP, a coisa natural a se fazer é coletar notícias em um determinado período de tempo e combiná-las em uma único arquivo, o qual é comprimido e enviado para um site remoto. Isso é chamado loteamento24.6.

Uma técnica alternativa é o protocolo ihave/sendme24.7 que evita a duplicação de artigos que estão sendo transferidos, além de economizar banda de comunicação. Ao invés de colocar todos os artigos em arquivos de lote e enviá-los em conjunto, somente as identificações dos artigos são combinadas em um imenso arquivo ``eutenho'' e enviadas para o site remoto. Este lê as mensagens, compara com seu arquivo de histórico e retorna uma lista de artigos que ele deseja em um arquivo do tipo ``meenvie''. Isso faz com que somente estes artigos sejam enviados.

Obviamente, eutenho/meenvie somente faz sentido ao envolver dois grandes sites que recebem notícias de diversos alimentadores independentes e que monitoram um ao outro com freqüência suficiente para que exista um fluxo eficiente de notícias.

Sites que estão na Internet geralmente baseiam-se em programas que utilizam TCP/IP e que utilizem o Protocolo de Transferência de Notícias de Rede - NNTP.24.8 Ele transfere notícias entre alimentadores e provê acesso Usenet para usuários individuais ou sistemas remotos.

NNTP conhece três maneiras diferentes de transferir notícias. Um na versão em tempo real do eutenho/meenvie, também conhecida como enviando notícias. A segunda técnica é chamada recebendo notícias, na qual o cliente solicita uma lista de artigos de um determinado grupos de notícias ou hierarquia que tenha sido recebida pelo servidor após uma data especificada e escolhe entre os não encontrados no arquivo de histórico. A terceira forma permite a leitura de notícias interativamente e permite que um leitor de notícias recupere artigos a partir de grupos de notícias especificados, assim como a postagem de artigos com informações incompletas de cabeçalho.

Em cada site, notícias são mantidas em uma hierarquia de diretórios sob o /var/spool/news, cada artigo em um arquivo separado e cada grupo de notícias em um diretório em separado. O nome do diretório é constituído pelo nome do grupo de notícias, com os componentes fazendo parte do nome do caminho. Por exemplo, artigos comp.os.linux.misc são mantidos no diretório /var/spool/comp/os/linux/misc. Os artigos em um grupo de notícias recebem números na ordem em que chegam ao site. Este número é utilizado como nome do arquivo. A faixa de números de artigos que estejam online no momento é mantida em um arquivo chamado active, o qual serve simultaneamente como uma lista dos grupos de mensagens conhecidas no site local.

Uma vez que o espaço em disco é um recurso limitado24.9, é necessário eliminar artigos após um determinado tempo. Isso é chamado de expiração. Normalmente artigos de certos grupos e hierarquias expiram após um determinado número de dias transcorridos da sua chegada. Isso pode ser redefinido pelo remetente do artigo, o qual pode especificar uma data de expiração no campo Expires: do cabeçalho do artigo.


próximo acima anterior sumário índice
Próximo: 25. C News Acima: 24. Notícias na Internet Anterior: 24.2 O Que é   Sumário   Índice
www.conectiva.com