@article{26363, author = {{Geierhos, Michaela}}, issn = {{1798-2340}}, journal = {{Journal of Advances in Information Technology (JAIT)}}, number = {{4}}, pages = {{222--233}}, title = {{{Customer Interaction 2.0: Adopting Social Media as Customer Service Channel}}}, volume = {{2}}, year = {{2011}}, } @inproceedings{26366, author = {{Geierhos, Michaela}}, booktitle = {{Proceedings of the 30th International Conference on Lexis and Grammar 2011}}, pages = {{123--130}}, title = {{{Towards a Local Grammar-based Persondata Generator for Wikipedia Biographies}}}, year = {{2011}}, } @article{26368, author = {{Geierhos, Michaela and Bouraoui, Jean-Leon and Watrin, Patrick}}, issn = {{0176-599X}}, journal = {{Arbeiten zur Mehrsprachigkeit / Folge B}}, pages = {{45--50}}, title = {{{Towards Multilingual Biographical Event Extraction}}}, volume = {{96}}, year = {{2011}}, } @article{26367, author = {{Geierhos, Michaela and Lee, Yeong Su and Bargel, Matthias}}, issn = {{0176-599X}}, journal = {{Arbeiten zur Mehrsprachigkeit / Folge B}}, pages = {{219--222}}, title = {{{Processing Multilingual Customer Contacts via Social Media}}}, volume = {{96}}, year = {{2011}}, } @inbook{1117, author = {{Geierhos, Michaela and Blanc, Olivier}}, booktitle = {{Actes du 27e Colloque international sur le lexique et la grammaire (L’Aquila, 10-13 septembre 2008)}}, editor = {{De Gioia, Michele}}, isbn = {{9788854831667}}, location = {{Rome, Italy}}, pages = {{95--110}}, publisher = {{Aracne}}, title = {{{BiographIE - Biographical Information Extraction from Business News}}}, volume = {{2}}, year = {{2010}}, } @book{1118, abstract = {{Das wesentliche Ziel der vorliegenden Publikation ist die Erstellung von sprachspezifischen Modulen im Bereich der Biographischen InformationsExtraktion (BiographIE). Unter Informationsextraktion verstehen wir die automatisierte Analyse von Dokumenten im Hinblick auf das Entdecken und Normalisieren von semantisch interessanten Entitäten und deren Eigenschaften. Das Hauptgewicht der Arbeit liegt auf sehr detaillierten und umfangreichen linguistischen Grammatiken im Bereich der Beschreibung von Personen und deren Beziehungen zu anderen relevanten Entitäten (z.B. Organisationen, Orte, Datums- und Zeitangaben) in Texten. Neben den öffentlichen und privaten Eigenschaften von Personen (Geburtsdatum, Nationalität etc.) sollen vor allem alle biographisch relevanten Attribute aus Texten extrahiert werden können. Dazu gehören in erster Linie berufliche Werdegänge, Anstellungsverhältnisse, Rollen in Firmen und ähnliche Eigenschaften. Da alle diese Attribute in unzählbar verschiedenen Formen ausgedrückt werden können, müssen sehr umfangreiche Lexika und sehr detaillierte grammatische Beschreibungen erstellt werden. Dies geschieht hauptsächlich bei der systematischen Evaluierung von Korpora. Je umfangreicher diese sind, desto adäquater werden die erstellten Grammatiken sein. Im Gegensatz zu den heute üblichen statistischen, auf maschinellem Lernen basierenden Verfahren setzen wir auch umfangreiche semi-automatisch erstellte, linguistische Module ein, die dann durch systematische Evaluierung auf Korpora schnell ergänzt und verbessert werden können. Basierend auf unseren Extraktionsmethoden ist es nun möglich, im Bereich der semantischen Suche deutliche Fortschritte zu machen. Insbesondere Personensuchmaschinen können sich unsere detaillierten Analysemethoden zu Nutze machen, um beispielsweise zu ermitteln, wer in welcher Funktion bei welcher Firma von wann bis wann beschäftigt war.}}, author = {{Geierhos, Michaela}}, isbn = {{9783862880133}}, keywords = {{Natural Language Processing}}, pages = {{286}}, publisher = {{Lincom}}, title = {{{BiographIE - Klassifikation und Extraktion karrierespezifischer Informationen}}}, volume = {{5}}, year = {{2010}}, } @inproceedings{1114, abstract = {{This paper presents a system that uses the domain name of a German business website to locate its information pages (e.g. company profile, contact page, imprint) and then identifies business specific information. We therefore concentrate on the extraction of characteristic vocabulary like company names, addresses, contact details, CEOs, etc. Above all, we interpret the HTML structure of documents and analyze some contextual facts to transform the unstructured web pages into structured forms. Our approach is quite robust in variability of the DOM, upgradeable and keeps data up-to-date. The evaluation experiments show high efficiency of information access to the generated data. Hence, the developed technique is adaptive to non-German websites with slight language-specific modifications, and experimental results on real-life websites confirm the feasibility of the approach.}}, author = {{Lee, Yeong Su and Geierhos, Michaela}}, booktitle = {{Proceedings of the 9th Dutch-Belgian Information Retrieval Workshop}}, editor = {{Aly, Robin and Hauff, C. and Hiemstra, Djoerd and Huibers, Theo W.C. and de Jong, Franciska M.G.}}, issn = {{0929-0672}}, keywords = {{company search, information extraction, sublanguage}}, location = {{Enschede, The Netherlands}}, pages = {{79--86}}, publisher = {{Centre for Telematics and Information Technology (CTIT), University of Twente}}, title = {{{Business Specific Online Information Extraction from German Websites}}}, year = {{2009}}, } @inproceedings{1115, abstract = {{This paper presents an approach to extract data records from websites, particularly ones with event calendars. We therefore use language-specific key expressions and HTML patterns to recognize every single event given on the investigated web page. One of the most remarkable advantages of our method is that it does not require any additional classification steps based on machine learning algorithms or keyword extraction methods; it is a so-called one-step mining technique. Our experimental results obtained on German opera websites show excellent results in precision and recall. Furthermore, we could demonstrate that our proposed technique outperforms other data record mining applications run on event sites.}}, author = {{Lee, Yeong Su and Geierhos, Michaela}}, booktitle = {{KDML’09 Tagungsband. Workshop-Woche: Lernen - Wissen - Adaptivität. LWA 2009. 21.-23.09.2009}}, location = {{Darmstadt, Germany}}, pages = {{68--71}}, title = {{{Key Expression driven Record Mining for Event Calendar Search}}}, year = {{2009}}, } @inbook{1116, abstract = {{This paper presents a system that uses the domain name of a German business website to locate its information pages (e.g. company profile, contact page, imprint) and then identifies business specific information. We therefore concentrate on the extraction of characteristic vocabulary like company names, addresses, contact details, CEOs, etc. Above all, we interpret the HTML structure of documents and analyze some contextual facts to transform the unstructured web pages into structured forms. Our approach is quite robust in variability of the DOM, upgradeable and keeps data up-to-date. The evaluation experiments show high efficiency of information access to the generated data. Hence, the developed technique is adaptive to non-German websites with slight language-specific modifications, and experimental results on real-life websites confirm the feasibility of the approach.}}, author = {{Lee, Yeong Su and Geierhos, Michaela}}, booktitle = {{Computational Linguistics and Intelligent Text Processing: 5th International Conference, CICLing 2004, Seoul, Korea, February 15-21, 2004, Proceedings}}, editor = {{Gelbukh, Alexander}}, isbn = {{978-3-642-00381-3}}, location = {{Mexico City, Mexico}}, pages = {{369--381}}, publisher = {{Springer}}, title = {{{Business Specific Online Information Extraction from German Websites}}}, doi = {{10.1007/978-3-642-00382-0_30}}, volume = {{5449}}, year = {{2009}}, } @inproceedings{1108, abstract = {{Ce papier présente le contexte linguistique et la modélisation de notre système iBeCOOL (Informations Biographiques Extraites à l’aide de COntextes Observés Linguistiquement) dédié à l’extraction d’informations biographiques dans les textes de la presse financière en langue anglaise. La notion d’événement biographique (tel que la naissance, le mariage, la carrière professionnelle) est caractérisée formellement par un schéma prédicatif à plusieurs arguments dont l’un étant une instance de la classe d’objets . Notre approche consiste à décrire ces types de relations à l’aide de grammaires locales etde lexiques terminologiques. Nos résultats montrent que cette approche semble viable et nous poussent à élargir cette étude par l’analyse de nouveaux genres textuels.}}, author = {{Geierhos, Michaela and Blanc, Olivier and Bsiri, Sandra}}, booktitle = {{Proceedings of the Lexis and Grammar Conference 2008}}, keywords = {{extraction d’informations biographiques, elations sémantiques, grammaires locales, entités nommées, enrichissement du lexique}}, location = {{L'Aquila, Italy}}, pages = {{241--248}}, title = {{{iBeCOOL - Extraction d'informations biographiques dans les textes financiers}}}, year = {{2008}}, } @inbook{1109, author = {{Geierhos, Michaela and Bsiri, Sandra}}, booktitle = {{Linguistics, Computer Science and Language Processing: Festschrift for Franz Guenthner on the Occasion of His 60th Birthday (Tributes 6)}}, editor = {{Gross , Gaston and Schulz, Klaus U.}}, isbn = {{978-1-904987-80-2}}, pages = {{103--126}}, publisher = {{College Publications}}, title = {{{ProfilPro: Reconstitution automatique d'un profil professionnel à partir des documents du Web}}}, volume = {{6}}, year = {{2008}}, } @article{1110, author = {{Geierhos, Michaela and Blanc, Olivier and Bsiri, Sandra}}, journal = {{Traitement Automatique des Langues (TAL)}}, number = {{1}}, pages = {{167--190}}, publisher = {{ATALA}}, title = {{{RELAX - Extraction de relations sémantiques dans les contextes biographiques}}}, volume = {{49}}, year = {{2008}}, } @article{1169, abstract = {{The standard approach of job search engines disregards the structural aspect of job announcements in the Web. Bag-of-words indexing leads to a high amount of noise. In this paper we describe a method that uses local grammars to transform unstructured Web pages into structured forms. Evaluation experiments show high efficiency of information access to the generated documents.}}, author = {{Bsiri, Sandra and Geierhos, Michaela and Ringlstetter, Christoph}}, issn = {{1870-4069}}, journal = {{Research in Computing Science}}, pages = {{201--212}}, publisher = {{National Polytechnic Institute of Mexico}}, title = {{{Structuring Job Search via Local Grammars}}}, volume = {{33}}, year = {{2008}}, } @book{1106, author = {{Geierhos, Michaela}}, publisher = {{Ludwig-Maximilians-Universität}}, title = {{{Grammatik der Menschenbezeichner in biographischen Kontexten}}}, volume = {{2}}, year = {{2007}}, } @inproceedings{1107, abstract = {{Dieser Beitrag beschäftigt sich mit der Informationsextraktion aus Stellenanzeigen im französischsprachigen Web. Ziel dieser Arbeit ist es, unstrukturierte Dokumente in Repräasentationsvektoren anhand lokaler Grammatiken zu transformieren. Auf diese Weise wird es möglich, den Stellenmarkt für Jobsuchmaschinen transparenter zu gestalten, indem nur auf dem Inhalt der Anzeige in Form von Darstellungsvektoren anstatt auf unübersichtlichem Fließtext gesucht werden muss.}}, author = {{Bsiri, Sandra and Geierhos, Michaela}}, booktitle = {{LWA 2007: Lernen - Wissen - Adaption, Halle, September 2007, Workshop Proceedings}}, editor = {{Hinneburg, Alexander }}, isbn = {{978-3-86010-907-6}}, location = {{Halle (Saale), Germany}}, pages = {{229--236}}, publisher = {{Martin-Luther-University}}, title = {{{Informationsextraktion aus Stellenanzeigen im Internet}}}, year = {{2007}}, }