(c) iqvik/istockphoto.com

F.A.Z.-Artikeldaten zu Forschungs- oder Trainingszwecken?

Kein Problem mit den F.A.Z. Text und Data Mining-Services.

 

Benötigen Sie für ein Forschungsvorhaben oder im Rahmen Ihres Studiums F.A.Z.-Artikeldaten um diese zu Analysezwecken computer- bzw. softwaregestützt zu untersuchen oder einen Sprachkorpus aufzubauen?

Möchten Sie für eine wissenschaftliche Untersuchung oder eine kommerzielle Auswertung die Webseite www.faz.net oder die Webseiten unserer anderen Quellen crawlen und die so gewonnenen Daten z.B.in eine Datenbank einspielen und mittels einer Software aufbereiten und analysieren?

Sind Sie eine Firma und z.B. im Bereich Spracherkennung oder Assistenzsysteme tätig und benötigen hochwertige Textdaten zu Trainingszwecken für die Produktentwicklung und Optimierung?

Gerne stellen wir Ihnen nach Bedarf die passenden Daten und Rechte* zur Verfügung. Bitte sprechen Sie uns hierzu einfach an und schildern uns Ihr Anliegen so genau wie möglich. Welche Angaben wir von Ihnen benötigen, erläutern wir Ihnen hier.

Das F.A.Z.-Archiv gewinnt übrigens selbst täglich aus den eigenen Artikeln Metadaten auf Basis modernster semantischer Technologien.

Auch komplexe und mehrfach geschachtelte Suchanfragen mittels boolescher Operatoren und Wildcards sind für unsere hochleistungsfähige Software kein Problem.

Gerne helfen wir Ihnen außerdem im Bedarfsfall mit Statistiken zu Häufigkeiten oder Verteilungen einzelner Zeichenketten, Wörter oder Wortkombinationen weiter.

 

*Ab dem 01.03.2018 gilt das neue Urheberrechts-Wissensgesellschafts-Gesetz (UrhWissG). Gemäß § 60d Urheberrechtsgesetz ist lediglich Forschenden die automatisierte Auswertung von Texten zu wissenschaftlichen Zwecken (sog. Text- und Data Mining) ohne vorherige Freigabe durch den Rechteinhaber erlaubt. Dies gilt jedoch nur für die nicht kommerzielle wissenschaftliche Forschung. Für die eigene wissenschaftliche Forschung können nach § 60c UrhG keine vollständigen F.A.Z.-Artikel verwendet werden.

Wenn Sie unsicher sind, ob die Verwendung von F.A.Z.-Inhalten im Rahmen Ihres Vorhabens von diesen Ausnahmen abgedeckt ist, helfen wir Ihnen gerne weiter.

..............................................................................................................................................................................................................................................

Korpora mit F.A.Z.-Inhalten für die wissenschaftliche Nachnutzung:

Projekt „MigTex – Textressourcen für die Migrations- und Integrationsforschung“

Enthalten sind neben anderen Inhalten Artikeltexte der Jahrgänge 2000 bis 2019 aus Frankfurter Allgemeine Zeitung und Frankfurter Allgemeine Sonntagszeitung zum Themenkomplex Migration.

Ansprechpartner ist die Universität Duisburg-Essen und dort das Interdisziplinäres Zentrum für Integrations- und Migrationsforschung / InZentIM.

Webseite für nähere Informationen und Kontakt: http://www.inzentim.de/migtex-textressourcen-fuer-die-migrations-und-integrationsforschung/