Treffen Sie unsere Data Queens

Die Umwandlung unstrukturierter Daten in verwertbare Erkenntnisse ist unser Wertversprechen. Lernen Sie das Team kennen, das die Daten aus weltweiten Quellen sammelt und sie für unsere Kunden leicht zugänglich macht.

Unser Datenteam besteht aus sieben Datenspezialisten und wird von Kirill Inkine geleitet. Es ist unser vielfältigstes Team in Bezug auf Nationalitäten und Standorte. Farzana und Katja, beide in Finnland ansässig, sind 2019 zum Team gestoßen. 

- Ich komme aus Pakistan und bin nach Finnland gezogen, weil es ein großartiger Ort ist, um Data Science zu studieren, erzählt Farzana. - Ich wollte auch Europa erkunden, aber dann kam die Pandemie und ich konnte nicht reisen - noch nicht", lächelt sie. 

Farzana hat einen Doppelmaster. Der erste war in Informatik. Sie arbeitete in einem der bekanntesten Krankenhäuser Pakistans, als ihr Interesse an den Datenwissenschaften geweckt wurde. 

- Meine Masterarbeit befasst sich mit natürlicher Sprachverarbeitung (NLP). Ich erforsche, wie man NLP nutzen kann, um große Textmengen zusammenzufassen und die wichtigsten Punkte herauszugreifen. Stellen Sie sich vor, wie viel Zeit die Studenten dadurch sparen könnten, lacht Farzana.  

Ekatarina, oder Katja, wie sie genannt wird, kommt aus Russland. Wie Farzana kam sie zum Studium nach Finnland. 

 - Mein Master ist eigentlich in Business and Finance, mit einem Nebenfach in Data Science", sagt Katja. - Ich habe mich für statistische Methoden interessiert und war froh, dem Datenteam bei Legentic beizutreten. Meine Kollegen sind sehr hilfsbereit und ich habe eine Menge gelernt. 

Sammeln, Strukturieren und Anreicherung von Daten

Unser Datenteam ist dafür verantwortlich, öffentliche Daten zu sammeln, sie zu strukturieren, anzureichern und die Daten schließlich unseren Kunden zur Verfügung zu stellen. 

- Wir erstellen Crawler, die öffentliche Daten sammeln. Diese müssen für jede einzelne Website maßgeschneidert sein, erklärt Farzana. - Und sie müssen ständig aktualisiert werden, da die Webquellen ihre Seiten ständig ändern und die Technologien weiterentwickeln. Es ist wie ein Katz- und Mausspiel. 

- Beim Aufbau eines Crawlers definieren wir die verschiedenen Datenquellen - Name, Telefonnummer, welcher Text extrahiert werden soll usw. Und dann kennzeichnen wir die Daten, so dass sie bei einer Suche leicht zugänglich sind. 

- Wir verarbeiten die Daten auf verschiedene Weisen. Unsere Crawler gehen mehrere Seiten durch und kombinieren die Daten auf intelligente Weise, erklärt Katja. - Wir verwenden Künstliche Intelligenz bei der Bilderkennung und zur Verbesserung von Bildern mit schlechter Auflösung. Das ist sehr nützlich, um z. B. ein Autokennzeichen erkennen zu können. 

Intelligente Suche

Farzana erzählt, dass NLP heute in der Datenbank von Legentic verwendet wird. 

- Wir verwenden einen NLP Parser, erklärt sie. - Wenn wir Daten von Webseiten crawlen, fügen wir den Text in spezielle Etiketten ein. Auf diese Weise kann die Datenbank einen Treffer liefern, der zum Beispiel "surrounding" enthält, wenn der Kunde eine Suche nach dem Wort "surround" durchführt. 

Derzeit haben wir 400 Crawler, die Daten von 540 Domains auslesen. Da sich die Technologie ständig weiterentwickelt, können wir uns keineswegs auf unseren Lorbeeren ausruhen.