Die am DIW Berlin angesiedelte forschungsbasierte Infrastruktureinrichtung Sozio-oekonomische Panel (SOEP) ist eine der größten und am längsten laufenden multidisziplinären Panelstudien weltweit, für die derzeit jährlich etwa 30.000 Menschen in knapp 15.000 Haushalten befragt werden. Das SOEP hat den Anspruch den gesellschaftlichen Wandel zu erfassen und steht somit immer neuen und vielfältigen Themen- und Aufgabenfelder gegenüber. Seine Datenerhebung und -generierung folgt dem Konzept des Survey bzw. Data Life Cycle.
Zum nächstmöglichen Zeitpunkt suchen wir eine*n
(Vollzeit mit 39 Wochenstunden, Teilzeit möglich)
Wir suchen einen Wissenschaftliche*n Mitarbeiter*in mit Schwerpunkt Data Scientist mit großem Interesse an und Erfahrung mit Data Scraping und semantischen Technologien. Wir möchten, dass Sie Ihre Erfahrung in ein aktuelles Forschungsprojekt einbringen, bei dem es darum geht, die Haushaltspaneldaten des SOEP mit online verfügbaren Daten von Unternehmen zu verknüpfen, um mehr über die Beschäftigten und ihr Arbeitsumfeld zu erfahren und Fragen folgender Art zu beantworten: Was sind die Determinanten für gute Arbeitgeber-Arbeitnehmer-Beziehungen? Welche Unternehmen bieten ein besonders gutes Umfeld für ihre Mitarbeiter? Wir erwarten, dass Sie sich damit aktiv in die Forschungsaktivitäten des Bereichs „Angewandte Paneldatenanalysen“ im SOEP einbringen.
Aufgaben:
- Systematische Extraktion von Informationen aus öffentlich und online verfügbaren Unternehmensdaten (Schreiben von Application Programming Interface Requests, Crawling von Websites und Informationsextraktion)
- Aufbau einer strukturierten Unternehmensdatenbank, z. B. zu Bilanzen und Zukunftserwartungen der Unternehmen, aus halbstrukturierten Texten
- Anwendung und Feinabstimmung großer Sprachmodelle für die Datenextraktion (oder semantische Suche)
- Verknüpfung mit den SOEP-Befragten (d.h. Firmennamen, wie sie von den (selbständigen) SOEP-Befragten angegeben wurden)
- Dokumentation der neuen Datenbank
- Quantitative Forschung mit den verknüpften Daten und Beitrag zur arbeitsökonomischen Forschung des SOEP
- Dissemination der Forschungsergebnisse in Gesellschaft und Politik
Anforderungen:
- Master in Wirtschaftsinformatik oder verwandten Bereichen
- Erfahrung mit dem Crawlen von Websites und dem Schreiben von API-Anfragen
- Allgemeines Verständnis von Sprachmodellen
- Aufbau von Datenbanken und Datendokumentation
- Selbstständige, analytische und lösungsorientierte Arbeitsweise, gepaart mit hohem Verantwortungsbewusstsein und Engagement für exzellente Forschungsstandards
- Sicherer Umgang mit Datenanalysemethoden und Software (R, Stata, Python)
- Ausgeprägte Teamfähigkeit
- Sehr gute sprachliche Fähigkeiten in Deutsch und Englisch
Wir bieten:
- Die Möglichkeit, in einem interdisziplinären und internationalen Forschungsumfeld zu arbeiten
- Ihre Forschung in den Rahmen des Sozio-ökonomischen Panels zu integrieren
- eigene Forschungsarbeiten in den oben genannten Bereichen zu entwickeln
- zeitlich und örtlich flexibel zu arbeiten
Die Vergütung erfolgt nach Entgeltgruppe 13 TVöD Bund. Der Vertrag ist zunächst befristet bis 31. Dezember 2024. Eine Verlängerung der Stelle wird nach Maßgabe der finanziellen Möglichkeiten angestrebt.
Das DIW Berlin bietet den Beschäftigten neben flexiblen Arbeitszeiten auch mobiles Arbeiten sowie ein bezuschusstes Firmenticket an.
Wir wertschätzen Vielfalt und begrüßen daher alle Bewerbungen – unabhängig von Geschlecht, Behinderung, Nationalität oder ethnischer und sozialer Herkunft.
Bitte bewerben Sie sich online mit den üblichen Unterlagen (Anschreiben, Lebenslauf, Zeugniskopien, Referenzen) unter Angabe der Kennziffer SOEP-16-23 bis zum 16.07.2023. Weitere Informationen über das DIW Berlin finden Sie auf unserer Homepage unter www.diw.de. Für weitere Informationen über den Forschungsbereich wenden Sie sich bitte an Carsten Schröder (cschroeder(at)diw.de).
Das DIW Berlin (Deutsches Institut für Wirtschaftsforschung) ist seit 1925 eines der führenden Wirtschaftsforschungsinstitute in Deutschland. Es erforscht wirtschafts- und sozialwissenschaftliche Zusammenhänge in gesellschaftlich relevanten Themenfeldern und berät auf dieser Grundlage Politik und Gesellschaft. Das Institut ist national und international vernetzt, stellt weltweit genutzte Forschungsinfras