Die Inspiration
Kann man durch das Sammeln von Nachrichten interessante Theorien ableiten? „Veröffentlichungen nach Wochentag und Zeit?“ oder „Veröffentlichungshäufung nach Wochentag“ sind hier noch der Anfang.
Welche Wörter und Satzbauten werden in den Texten genutzt? Welche Personen oder Dinge in der Nachricht stehen mit anderen am öftesten im Kontext? Wie oft werden Nachrichten von dritten Kommentiert mit ähnlichen Textfragmenten kopiert? Das sind nur einige der möglichen Kausalitäten die es zu erforschen gilt.
Seit Anfang diesen Monates (Februar 2017) sammle ich hierzu Nachrichten Artikel von verschieden Nachrichten Server. Unter anderem faz.net, spiegel.de, welt.de, tagesschau.de, tomshardware.de, zak.de auto-motor-sport.de und ariva.de.
Hierzu wurde ein kleiner Server programmiert, der zyklisch das RSS-Feed der Seiten auswertet und bei neuen Inhalten diese Speichert und zusätzlich in flachen Tabellen pro Internetseite ablegt.
Inspiriert wurde ich hier durch D. Kriesel und seinem Artikel auf der 33C3 „SpiegelMining“. Weiterlesen →