Das Wissensportal für IT-Professionals. Entdecke die Tiefe und Breite unseres IT-Contents in exklusiven Themenchannels und Magazinmarken.

SIGS DATACOM GmbH

Lindlaustraße 2c, 53842 Troisdorf

Tel: +49 (0)2241/2341-100

kundenservice@sigs-datacom.de

Projekt mit Garagencharakter: Trooia gegen Google

„Heizkörper bleibt kalt“, „plötzlich Fieber“ – jede Sucheingabe bei Google hinterlässt Spuren und Informationen über die Fragenden – und ruft Werbetreibende auf den Plan. Dem Schweizer Christoph Cronimund waren die Suchergebnisse erst zu unübersichtlich und schließlich auch zu werbelastig. Er entwickelte den Dienst Trooia, der Antworten von Google liefert, die anonymisiert und werbefrei sind.
Author Image
Christoph Witte

Chefredakteur IT Spektrum und BI-Spektrum


  • 28.05.2021
  • Lesezeit: 7 Minuten
  • 82 Views

JavaSPEKTRUM: Was war Ihre Motivation?

Cronimund: Als SEO-Experte arbeite ich beruflich mit Google. Die ursprüngliche Idee war, Google-Resultate übersichtlicher darzustellen. Anonymität oder Werbefreiheit standen nicht im Fokus – in der ersten Trooia-Version war Werbung auch noch enthalten. Doch im Lauf der Zeit hat Google die Werbung vom Rand in den Fokus gerückt – bezahlte Suchergebnisse stehen nun immer auf den oberen Positionen der Liste. Wer organische Suchergebnisse will, muss scrollen, das hat mich geärgert. Zu Beginn hat mich die Werbung nicht gestört, weil sie dezenter am Rand der Seite stand. Doch mir wurde bewusst, dass eigentlich die Suchergebnisse durch kommerzielle Interessen verzerrt werden. Das kommt bei mir und vielen anderen Menschen nicht gut an. Es erinnert mich an eine Zeile in einem Song von Bob Marley: „You can fool some people sometimes, but you can´ t fool all the people all the times”.

Wie funktioniert Trooia?

Trooia ist quasi ein Mittelsmann zwischen Benutzer und Google, der Web-Scraping betreibt. Dem Anwender präsentiert sich eine Suchmaske, in die er den Suchbegriff eingibt. Die Trooia-Server greifen dann Google-Resultate ab, filtern Werbung heraus und stellen sie anders dar. Dazu dürfen die Server nicht blockiert werden. Deshalb nutze ich einen Proxy-Pool. Wenn Google einen Proxy sperrt, wechselt Trooia einfach zu einem anderen Proxy. So weiß Google nicht, von wo und wem die Suchanfrage kommt.

Das ist alles?

Nein, ganz so einfach ist es nicht. Denn Google verwendet Algorithmen, die versuchen herauszufinden, ob die Serverzugriffe von Maschinen oder echten Nutzern kommen.

Trooia ist derzeit offline. Was passiert gerade?

Trooia hat als Hobbyprojekt angefangen. Die Nutzer beschränkten sich auf meine Familie, Freunde und Bekannten. Als sich die Öffentlichkeit zunehmend für das Projekt interessierte, stieg die Anwenderzahl. Für viele gleichzeitige Nutzer ist es jedoch nicht ausgelegt.

Ich musste das ganz neu aufbauen, vor allem auf der Serverseite. Die Server müssen mit der Last von mehreren Nutzern pro Sekunde klarkommen. Außerdem – und das ist der schwierigere Teil: Wenn es nur von wenigen benutzt wird, ist es noch nicht so kompliziert, unter dem Radar der Google-Server zu fliegen. Die Serverprobleme sind größtenteils gelöst und in den nächsten Wochen werden noch öffentliche Tests stattfinden.

Unter dem Radar fliegen: Schadet da Medienpräsenz nicht eher?

Es geht ja nur darum, technisch unter dem Radar von Google zu fliegen. Eine Sandburg hat auch keine Angst vor einem einzigen Sandkorn. Auch wenn das Projekt an Fahrt aufnimmt, macht das Google keine Angst.

Aber Sie umgehen das Geschäftsmodell von Google.

Ja. Aber mich stört, dass es zum Monopolisten Google keine Alternative gibt. Google ist gratis – aber nur mit Werbung. Bei Youtube gibt es jetzt beispielsweise die Möglichkeit, Youtube premium zu abonnieren. Außerdem wissen viele Anwender nicht, dass jeder Klick auf die Anzeige Werbetreibende unter Umständen mehrere Euro kostet. Solange dieses Bewusstsein fehlt, hat Google mit dem Konzept „gratis plus Werbung“ Erfolg. Wenn die Kenntnis über das Geschäftsmodell dahinter zunimmt, dann könnte jedoch auch ein alternatives Geschäftsmodell attraktiver werden. Aber Google ist clever genug, um das zu kalkulieren.

Haben Sie Trooia alleine entwickelt?

Ja. Ich habe Elektrotechnik studiert, bin Hobby-Programmierer und habe mit Java angefangen. Ich verfüge über genügend Vorwissen, um mir neue Technologien beizubringen. Das ganze Projekt basiert auf Node.js.

Warum ist keiner vorher auf die Idee gekommen?

Es gibt ja verschiedene Metasuchmaschinen. Jedoch sind die Unternehmen aus meiner Sicht nicht konsequent genug. Beispiel: DuckDuckGo und Startpage. Beide haben Werbepartnerschaften – entweder mit Bing oder mit Google. Und immer erscheint Werbung auch oberhalb der echten Suchergebnisse. Wer dann auf die Anzeige klickt, landet wieder vollständig im Tracking von Google oder Bing. Eine konsequente Umsetzung kann nur von einem Dienst geleistet werden, der nicht profitorientiert arbeitet.

Ist Trooia so erfolgreich, weil kein Geschäftsmodell dahintersteckt?

Der Hype in den Medien ist sicher auch dadurch verursacht, weil es ein Hobbyprojekt und dadurch sympathisch ist. Es hat halt diesen Garagencharakter.

Wie finanzieren Sie denn den Dienst?

Wenn nur wenige Personen Trooia nutzen, kann ich die Arbeit nebenher leisten. Die Kosten halten sich in Grenzen: Sie fallen in erster Linie für Dienste wie die Proxy-Server und die Captcha-Löser an. Aber wenn die Benutzerbasis breiter wird, dann kann ich die Kosten nicht mehr tragen. Es muss ein Finanzierungsmodell her.

Wie soll das fortgeführt werden?

Es gibt noch keinen konkreten Plan. Zusammen mit der Community will ich mir die Optionen anschauen, die es gibt und die auch akzeptiert werden. Es gibt Nutzer, die bereit wären, dafür monatlich zu bezahlen. Ich weiß allerdings, was ich nicht will: Ich will nicht wie Startpage oder andere Projekte Keyword-basierte Werbung einblenden. Eine Finanzierungsmöglichkeit wären Sponsoren. Allerdings bin ich von dieser Option auch kein wirklicher Fan. Es gäbe auch noch die Möglichkeit des Verursacherprinzips: eine Bezahlung, die abhängig von der Nutzung ist. Auch Spenden wie bei Wikipedia wären eine Option. Die Herausforderung ist: Ein Finanzierungsmodell zu finden, das einerseits den Dienst trägt und andererseits von den Benutzern akzeptiert wird.

Wie sieht das rechtlich aus? Ist das eine Grauzone?

Laut DSGVO wird kein Copyright verletzt, denn Google-Suchresultate sind nicht Copyright-geschützt. Das können sie gar nicht sein, weil Google selbst ja ein Scraper ist. Zudem werden bei Trooia keine personenbezogenen Daten gescrapt. Von daher sehe ich keine Probleme.

Muss man also nur befürchten, dass Google versucht, Sie technisch auszusperren?

Das ist eine Hürde. Aber Google hat hier keine Geschichte – im Gegensatz zu Linkedin, die schon Anklagen erhoben haben. Es gibt andere Anwendungsfälle für das Scrapen von Suchresultaten, die seit Langem existieren, zum Beispiel für Suchmaschinenoptimierer. Um das Aussperren mache ich mir weniger Sorgen. Das Finanzierungsmodell steht bei mir im Vordergrund.

Würden Sie Trooia an Google verkaufen?

Das ist keine Option. Denn das Unternehmen könnte so einen Dienst in relativ kurzer Zeit ja selbst realisieren.

Christoph Cronimund

Christoph Cronimund ist Experte für Suchmaschinenoptimierung (Englisch search engine optimization, SEO). Er hat an der ETH Zürich sowohl Elektrotechnik als auch Betriebswissenschaften studiert und verfügt über Erfahrung im Online-Marketing gepaart mit technischem Verständnis. Berufliche Erfahrungen konnte Christoph Cronimund als Entwicklungsingenieur und Produktmanager bei Siemens Schweiz und als Verantwortlicher für das weltweite Suchmaschinen-Marketing bei Swarovski.com erwerben.

Das Interview führte Christoph Witte, E-Mail: cwitte@wittcomm.de

. . .

Author Image

Christoph Witte

Chefredakteur IT Spektrum und BI-Spektrum
Zu Inhalten

Christoph Witte ist Gründer der Wittcomm Agentur für IT, Publishing und Kommunikation. Darüber hinaus ist er Chefredakteur von IT Spektrum sowie BI-Spektrum und wirkt zudem bei dem Magazin JavaSPEKTRUM mit.


Artikel teilen