Data Mining Teil 2 – nach einem Jahr – Analyse mit R der News pro Tag

Publizierte Nachrichten pro Jahr

Jetzt ist es an der Zeit die gesammelten Daten zu analysieren. Hierzu werden wir Sprache R benutzen.

Zuerst soll die Anzahl der publizierten Nachrichten pro Tag ausgewertet werden. Hierzu ist es wichtig einen Blick in die Tabellen zu werfen. Folgende Daten der Nachrichtenseite wurden gesammelt, sofern die die Daten im RSS-Feed oder im Artikel selber gefunden wurden:

  • PublishDate (datetime)
  • UtcDateTime (datetime)
  • LastUpdatedTime (datetime)
  • Title (string)
  • Description (string)
  • Categories (string)
  • Id (string)
  • Authors (string)
  • Contributors (string)
  • Copyright (string)
  • Link1 (hyperlink)
  • Link2 (hyperlink)

Ein Auszug einer Tabelle könnt ihr hier sehen.

Bild 1: Auszug der gespeichert Daten als Tabelle (zum vergrößern, klicken)

Weiterlesen

Kugeln

Präsentieren mit Prozent-Angaben

Für Präsentationen benötige ich sehr oft Angaben in %. Hier fehlen jedoch z.B. in PowerPoint schöne aussagekräftige Grafiken. Des Weiteren wäre es doch perfekt, wenn die Präsentation automatisch anhand einem aktuellen Datenpool generiert wird. Also warum kein C# Programm schreiben und die Kugeln selbst generieren lassen?

Hier das Resultat der fertigen Software, die Farbe ist frei wählbar:

Ein besonderen Dank gilt Dr. Urs Schaudt der mich bei diesem Projekt unterstützte. Weiterlesen