de.phhsnews.com


de.phhsnews.com / So extrahieren Sie Links auf jeder beliebigen Seite mithilfe von PowerShell

So extrahieren Sie Links auf jeder beliebigen Seite mithilfe von PowerShell


PowerShell 3 verfügt über viele neue Funktionen, einschließlich einiger leistungsstarker neuer webbezogener Funktionen. Sie vereinfachen die Automatisierung des Webs erheblich und heute zeigen wir Ihnen, wie Sie jeden einzelnen Link einer Webseite extrahieren und optional die Ressource herunterladen können.

Scraping des Webs mit PowerShell

Es gibt zwei neue Cmdlets, die das Web einfacher automatisieren, Invoke-WebRequest, das das Analysieren von lesbaren Inhalten erleichtert, und Invoke-RestMethod, das maschinenlesbaren Inhalt leichter lesbar macht. Da Links Teil des HTML einer Seite sind, sind sie Teil des menschenlesbaren Materials. Alles, was Sie tun müssen, um eine Webseite zu erhalten, ist Invoke-WebRequest und geben Sie ihm eine URL.

Invoke-WebRequest -Uri '//phhsnews.com'

Wenn Sie nach unten scrollen, sehen Sie die Antwort Als Eigenschaft für Links können wir die neue Elementauflistungsfunktion von PowerShell 3 verwenden, um diese herauszufiltern.

(Invoke-WebRequest -Uri '//phhsnews.com') .Links

Wie Sie sehen, bekommen Sie eine Menge der Links zurück, das ist, wo Sie Ihre Phantasie verwenden müssen, um etwas einzigartiges zu finden, um die Verbindungen herauszufiltern, die Sie suchen. Nehmen wir an, wir wollen eine Liste aller Artikel auf der Titelseite.

((Invoke-WebRequest -Uri '//phhsnews.com') .Links | Where-Objekt {$ _. Href -like "http * "} | Wo class -eq" title "). Titel

Eine weitere tolle Sache, die Sie mit den neuen Cmdlets machen können, ist die Automatisierung alltäglicher Downloads. Schauen wir uns an, wie wir automatisch das Bild des Tages von der Nat Geo Website abkratzen, dazu kombinieren wir die neuen Web-Cmdlets mit Start-BitsTransfer.

$ IOTD = ((Invoke-WebRequest -Uri ' // photography.nationalgeographic.com/photography/photo-of-the-day/').Links | Wo innerHTML ähnlich "* Wallpaper herunterladen *". href
Start-BitsTransfer -Quelle $ IOTD -Destination C: IOTD

Das ist alles. Haben Sie irgendwelche eigenen Tricks? Lassen Sie es uns in den Kommentaren wissen.


Warum hassen so viele Geeks den Internet Explorer?

Warum hassen so viele Geeks den Internet Explorer?

Es ist allgemein bekannt, dass fast jeder Geek den Internet Explorer mit Leidenschaft hasst, aber haben Sie sich jemals gefragt, warum? Werfen wir einen Blick auf die Geschichte und wo alles begann ... zumindest für die Nachwelt. Im Gegensatz zu dem, was Sie vielleicht denken, ist dieser Artikel nicht als Hass auf das Internet gedacht Explorer - seit IE 9 haben sie die Performance weiter verbessert, neue Features hinzugefügt und sie allgemein standardkonform gemacht.

(how-to)

Einrichten und Konfigurieren von Benutzerkonten unter Windows 10

Einrichten und Konfigurieren von Benutzerkonten unter Windows 10

Windows 8 führte Microsoft-Konten ein, bei denen es sich im Wesentlichen um Roaming-Konten handelt, mit denen Sie Einstellungen und Dateien von Computer zu Computer synchronisieren können. Heute möchten wir erläutern, was Windows 10 für die Benutzerkontenverwaltung und die verfügbaren Optionen bedeutet.

(how-to)