Mein side-project HRfilter.de

3rd November 2013 – 403 words

Als Mitarbeiter eine Firma, die sich vorrangig mit dem Thema Personalgewinnung beschäftigt, pflege ich schon seit geraumer Zeit eine Liste an Blogs und Portalen in meinem Feedreader die Neuigkeiten zu dem Thema verbreiten. Leider ist das ganze etwas suboptimal, da einige Quellen extrem viel veröffentlichen, andere weite Themenfelder besetzen und im Zweifel eine für mich interessante News in der Masse untergeht.

Angebracht wäre also ein Newsaggregator oder Newsletter-Service zu dem Thema. Bisher habe ich noch keinen guten Newsaggregator zum Thema Personal/HR/Karriere gefunden. Deshalb habe ich beschlossen, selbst einen kleinen vollautomatischen Aggregator zu starten, HRfilter.de. Indiziert habe ich dabei alle möglichen Karriere-Blogs, das Personalmagazin, aber auch einige Twitterquellen. Wichtig war mir auch eine halbwegs sinnvolle Sortierung und Kategorisierung, um so auch bei nur wenig Zeit interessante Informationen zu finden.

Kategorisierung

Ein wichtiges Anliegen war für mich die automatische Kategorisierung von Blogartikeln, da manchmal Bewerber, manchmal Arbeitgeber und Recruiter angesprochen werden. Bisher bin ich mit einer statischen Keywordliste recht weit gekommen, die ich in Zukunft noch erweitern werde Sobald ich eine große Menge an Text zu dem Thema gesammelt habe, werde ich auch statistische Klassifikationsverfahren ausprobieren.

Sortierung

Die Relevanz eines Eintrages bewerte ich bisher anhand:

  • Aktivität auf Twitter, Facebook, XING und LinkedIn zu diesem Beitrag
  • Wortlänge des dahinterliegenden Beitrags
  • ein subjektiver Basis-Wert dem ich der Quelle zuspreche
  • Aktualität

Diese Faktoren können über die Oberfläche auch selbst gewichtet werden.

Gewünschte Kategorien und Sortierungsgewichte werden im (HTML5-fähigen) Browser gespeichert und werden beim nächsten Seitenbesuch berücksichtigt.

Rechtliches

Als nicht-kommerzielles Projekt ist HRfilter eigentlich nicht vom Leistungsschutzrecht betroffen. Nichtsdestrotz verwende ich zur Anzeige nur Daten, die aus den jeweiligen Feeds durch die Blogs direkt stammen, also ausdrücklich zur maschinenlesbaren Veröffentlichung vorgesehen scheinen. Sollte ein Blog keine (kostenfreie, unverbindliche) Verlinkung wünschen, so nehme ich es natürlich sofort wieder raus.

Ausblick

Bisher bin ich recht zufrieden mit dem Ergebnis, plane aber in Zukunft noch einen Newsletter-Service, bei dem wöchentlich die interessantesten Links aus bestimmten Kategorien per Mail versandt werden. Ein weiterer Ansatzpunkt sind:

  • Verbesserung des Rankingalgorithmus, z.B. Berücksichtigung von Redundanz, d.h. möglichst neuwertiger Content wird höher bewertet
  • Links innerhalb der Artikel möglicherweise mit berücksichtigen
  • Viel mehr Blogs/Portale zu dem Thema anbieten
  • Die Kategorisierung verbessern, z.B. bessere Keywordlisten und später statistische Klassifikationsverfahren ausprobieren
  • Bessere multimediale Unterstützung, z.B. verlinkte Youtube-Videos direkt einbetten und verlinkte Bilder direkt anzeigen, soweit rechtlich möglich
  • mehr als 5 min aufwenden, um ein Logo zu kreieren :)

HRfilter.de