pt.phhsnews.com


pt.phhsnews.com / Como extrair links de qualquer página da Web usando o PowerShell

Como extrair links de qualquer página da Web usando o PowerShell


O PowerShell 3 tem muitos novos recursos, incluindo alguns novos recursos poderosos relacionados à Web. Eles simplificam drasticamente a automação da Web e, hoje, mostraremos como você pode extrair cada link de uma página da Web e, opcionalmente, baixar o recurso, se desejar.

Raspando a Web com o PowerShell

Há dois novos cmdlets que facilitam a automação da Web, Invoke-WebRequest, que facilita a análise de conteúdo legível por humanos, e Invoke-RestMethod, que facilita a leitura do conteúdo legível por máquina. Como os links fazem parte do HTML de uma página, eles fazem parte do material legível por humanos. Tudo o que você precisa fazer para obter uma página da Web é usar Invoke-WebRequest e fornecer uma URL.

Invoke-WebRequest -Uri '//phhsnews.com'

Se você rolar para baixo, verá a resposta uma propriedade de links, podemos usar o novo recurso de enumeração de membro do PowerShell 3 para filtrá-los.

(Invoke-WebRequest -Uri '//phhsnews.com') .Links

Como você pode ver, você obtém muito de links de volta, este é o lugar onde você precisa usar sua imaginação para encontrar algo exclusivo para filtrar os links que você está procurando. Vamos supor que queremos uma lista de todos os artigos na primeira página.

((Invoke-WebRequest -Uri '//phhsnews.com') .Links | Where-Object {$ _. Href -like “http * }} Onde class -eq “title”). Title

Outra grande coisa que você pode fazer com os novos cmdlets é automatizar os downloads diários. Vamos examinar automaticamente a imagem do dia do site do Nat Geo, para isso combinaremos os novos cmdlets da Web com o Start-BitsTransfer.

$ IOTD = ((Invoke-WebRequest -Uri ' // photography.nationalgeographic.com/photography/photo-of-the-day/').Links | Where innerHTML -like “* Download Wallpaper *”). href
Iniciar-BitsTransfer -Source $ IOTD -Destino C: IOTD

Isso é tudo que existe para isso. Tem algum truque legal? Deixe-nos saber nos comentários.


Como impedir que as páginas quebrem após a primeira linha de um parágrafo no Microsoft Word

Como impedir que as páginas quebrem após a primeira linha de um parágrafo no Microsoft Word

Em termos de composição, “viúvas” e “órfãos” são linhas no final ou início de um parágrafo que são separados do resto do parágrafo por uma quebra de página. Se você acha que as viúvas e os órfãos no seu documento do Word são uma distração, você pode habilitar uma configuração que os impeça. Então, qual é qual?

(how-to)

Como criar um arquivo zip com o mesmo nome de um arquivo selecionado

Como criar um arquivo zip com o mesmo nome de um arquivo selecionado

Se você usar as pastas compactadas incorporadas no Windows para criar arquivos zip, talvez tenha notado que ele cria o arquivo com o mesmo nome que o arquivo selecionado, o que fica estranho quando você seleciona vários arquivos. Veja como escolher o nome correto. Basicamente, o Windows usará o nome do arquivo para qualquer arquivo em que você clicou com o botão direito do mouse, mesmo quando você tiver vários arquivos selecionados.

(how-to)