DieManager von Morgen WiWi-TReFF.de - Zeitung & Forum für Wirtschaftsstudium & Karriere
EinstiegsgehälterData Scientist

Data Scientist

Autor
Beitrag
WiWi Gast

Data Scientist

Hey,

gibt es hier zufällig Leute, die Data Scientisten sind. Was war euer Einstiegsgehalt + Profil?

antworten
WiWi Gast

Data Scientist

push

antworten
WiWi Gast

Data Scientist

push

antworten
WiWi Gast

Data Scientist

Schreib doch erstmal was ueber dich :P

antworten
WiWi Gast

Data Scientist

BA Winfo 1,7
Ma Winfo 1,5 (Data Scientist Track)
Programmiersprachen: Python(Machine Learning), Java, SQL, Scala, VBA, gerade mit C++
Praktikum: 1x 3 Monate Auslandspraktikum, 1x Data Scientist Praktikum, 1x Big 4 Data Scientist Praktikum
Auslandssemster: Nein

antworten
WiWi Gast

Data Scientist

push

antworten
WiWi Gast

Data Scientist

Diplom Uni Bonn 1.4
PhD ETH Zurich Computer Science
Einstiegsgehalt 68 Deloitte
Python, R, MATLAB, C++

antworten
WiWi Gast

Data Scientist

Sollte ich noch einen PHD dranhängen? Bin der mit BA & MA von oben

antworten
WiWi Gast

Data Scientist

Nur falls du wirklich Bock drauf hast! Da du fragst, mutmasse ich mal, dass dies eher nicht der Fall ist. Wenn du weisst wo du hin willst, und es ist nicht Wissenschaft, dann bringt dir der PhD nicht so viel. Zumindest nicht in der Relation zu den Jahren die du investierst.

WiWi Gast schrieb am 03.02.2018:

Sollte ich noch einen PHD dranhängen? Bin der mit BA & MA von oben

antworten
WiWi Gast

Data Scientist

Naja, PHD hätte ich gerne für mein Ego, außerdem lese ich häufig bei Informatik jobs dass ein PHD ein Plus wäre

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 03.02.2018:

Naja, PHD hätte ich gerne für mein Ego, außerdem lese ich häufig bei Informatik jobs dass ein PHD ein Plus wäre

Wo willst du deinen PhD denn machen?

antworten
WiWi Gast

Data Scientist

An einer TU denke ich, Kit, TUM, Tu Berlin würden in Frage kommen

WiWi Gast schrieb am 04.02.2018:

WiWi Gast schrieb am 03.02.2018:

Naja, PHD hätte ich gerne für mein Ego, außerdem lese ich häufig bei Informatik jobs dass ein PHD ein Plus wäre

Wo willst du deinen PhD denn machen?

antworten
WiWi Gast

Data Scientist

Hi,

ich orientiere mich momentan von einer Analytics Stelle in der WPG um. Nun habe ich zwei Optionen: Analytics in einer Versicherung oder Analytics bei einem online-Unternehmen (Plattform zur Jobvermittlung).

Was meint ihr bietet aus Karriere- und technischer Sicht die meisten Weiterentwicklungschancen? Ich mag den Businessfaktor der Versicherung, jedoch hat das online-Unternehmen natürlich einen größeren Data-Lake und ist mehr im Bereich Spark/Tensorflow/Keras etc. unterwegs.

Zumindest mittelfristig gesehen. Kann man bspw. mit Erfahrung aus der Versicherung in den Handel oder die Industrie, also innerhalb des Analyticsbereichs?

Zu mir: Bin WiWi, statistische gut aufgestellt, auch was R, SQL etc. betrifft, jedoch kein Informatiker.

antworten
WiWi Gast

Data Scientist

push

antworten
danielamentzel

Data Scientist

Hallo zusammen,

ich bin Redakteurin und beschäftige mich derzeit mit dem Thema Wissensmanagement und Data Science. Im Rahmen meiner Recherche bin ich auf diese Seite gestoßen und dachte ich frage einfach mal frei raus:

  • Wie gehen Sie bei analytischen Daten vor, bzw. wie prognostizieren Sie aus der Datenanalyse die Zukunft von Wissensmanagement?
  • Wie gehen Sie bei analytischen Daten vor, bzw. wie kann Potenzial im Wissensmanagement aus Datenanalysen künftig geschöpft werden?
  • Wo informieren Sie sich, gibt es spezielle Themen Blogs/Foren für Data Scientists?

Ich freue mich über Infos und Austausch.

liebe Grüße Daniela

antworten
WiWi Gast

Data Scientist

LEL. Sollen wir gleich für dich den Artikel schreiben? Wäre doch einfacher und ehrlicher ;)

antworten
WiWi Gast

Data Scientist

Ein anonymes Forum ist auch eine super Quelle...

antworten
WiWi Gast

Data Scientist

Kurze Antwort: Das nennt sich Mathematik. Häufig auch dieser, von vielen verhasste Teil namens Statistik.

Tut mir leid für diese ironische Antwort, aber die Fragen sind nun wirklich sehr einfältig.

  • Wie gehen Sie bei analytischen Daten vor, bzw. wie prognostizieren Sie aus der Datenanalyse die Zukunft von Wissensmanagement?
  • Wie gehen Sie bei analytischen Daten vor, bzw. wie kann Potenzial im Wissensmanagement aus Datenanalysen künftig geschöpft werden?
antworten
WiWi Gast

Data Scientist

Hallo :)

Als Redakteurin gehört das Recherchieren und erarbeiten von Informationen und diese dann zu vermitteln zu meinem Aufgabengebiet. Ich bin somit auf Experten in den einzelnen Fachgebieten angewiesen. Wenn Sie andere Blickwinkel durchaus interessanter finden, ist das auch eine nützliche Information für mich. Vielen Dank für Ihre Rückmeldung.

Beste Grüße

antworten
WiWi Gast

Data Scientist

Push

antworten
WiWi Gast

Data Scientist

Puh, long story short:

Profil:
Bachelor Wirtschaftsinformatik (2.7, 9 Semester) -> faulheit, Party)
1x Praktikum in der Software Entwicklung, 1x im Data Analytics

Einstieg in Data Analytics mit 54k, weiterentwicklung zum Data Scientisten und nun seit 3 Jahren im Bereich tätig. Gehalt: 84k, 28.

Abschlüsse etc. sind total egal. Wenn sich junioren bewerben, dann schaue ich vor allem an:

  • Kennt er die grundlegenden Algorithmen ?
  • Kann er basic Datenbank Kenntnisse vorweisen?
  • Hat er ein kleines Portfolio, mal an einem Kaggle Wettbewerb teilgenommen und brennt er für die Materie ?

Falls das Ergebnis ja ist, dann kann er von mir aus auch einen Hauptschulabschluss haben - oder gar keinen.

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 19.12.2018:

Push

Geh in die USA, da lohnt buckeln wenigstens in diesem Bereich ;)

antworten
WiWi Gast

Data Scientist

Muss man für Data science mathematisch begabt sein?

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 07.01.2019:

Muss man für Data science mathematisch begabt sein?

Begabung ist nicht entscheidend. Verständnis von mathematischen Modellen und Zusammenhängen ist hingegen von zentraler Bedeutung.

antworten
WiWi Gast

Data Scientist

Data Science ist primär Statistik und Informatik. Du brauchst definitiv eine Affinität für IT-Prozesse.
Ansonsten logisches Denken. Das korreliert zumindest ein wenig mit Mathematik. ;)

antworten
WiWi Gast

Data Scientist

Affinität für IT-Prozesse?
Also ich schubs nur Daten von A nach B, sieb ein paar Dabei raus, korrigier ein paar, übertrage den Reste in ein anderes Format und dann werf ich ein paar Algos drauf und geh heim. Am nächsten Morgen öffne ich dann meine Wundertüte und schütte sie dem Kunden vor die Füße und sag sowas wie "Wir müssen stärker in Bereich Xy Vorstoßen, denn da geht nach den Ergebnissen unserer Analyse der Trend hin".

Der Kunde ist Happy und ich geh mit ein paar Kröten mehr in der Tasche die nächste Haustürklingel putzen ;)

antworten
WiWi Gast

Data Scientist

Wie kann man als BWLer Data Scientist werden? Was wäre ein typischer Werdegang?

antworten
WiWi Gast

Data Scientist

Ein guter Data Scientist ist ein angewandter Mathematiker (wie z.B. ein theoretischer Physiker), der auf Grundlage von Daten oft mittels Machine Learning Algorithmen mathematische Modelle aufstellt. Er erforscht dabei, welches Modell aus einem unendlich großem Pool an theoretisch möglichen Modellen das beste ist. Man sollte daher die Erfahrung und das Interesse für das mathematische Modellieren mitbringen.

antworten
WiWi Gast

Data Scientist

Was häufig übesehen wird: Data Science ist nicht .fit() und .predict()...

antworten
WiWi Gast

Data Scientist

Alles was R, SAS oder sogar Excel verwendet bezeichnet sich heute als Data Scientist, weil das Berufsbild so unklar definiert ist und hip klingt. Die meisten sind allerdings Analysten. Wenn jemand kein Python kann, ist die Wahrscheinlichkeit hoch, dass er kein Data Scientist ist, sondern eher Statistiker oder Analyst.

antworten
WiWi Gast

Data Scientist

Denke, hier wird in Deutschland zu wenig auf den Data Science Prozess als Ganzes geschaut. Gerade auf Seite der Unternehmen haben die Leute leider häufig erschreckend wenig Einblick und klassifizieren jeden, der seine R Skripte laufen lässt als Data Scientist...

WiWi Gast schrieb am 08.01.2019:

Alles was R, SAS oder sogar Excel verwendet bezeichnet sich heute als Data Scientist, weil das Berufsbild so unklar definiert ist und hip klingt. Die meisten sind allerdings Analysten. Wenn jemand kein Python kann, ist die Wahrscheinlichkeit hoch, dass er kein Data Scientist ist, sondern eher Statistiker oder Analyst.

antworten
WiWi Gast

Data Scientist

Bachelor Mathe, 1.0
Einstiegsgehalt all in 92k, Dax30 im Bereich künstliche Intelligenz. 38 Stunden Woche :)

Mittlerweile 130k. Bin super zufrieden, alter jetzt 25

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 12.05.2019:

Bachelor Mathe, 1.0
Einstiegsgehalt all in 92k, Dax30 im Bereich künstliche Intelligenz. 38 Stunden Woche :)

Mittlerweile 130k. Bin super zufrieden, alter jetzt 25

1/10 und jetzt wieder ab in die Bib.

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 12.05.2019:

WiWi Gast schrieb am 12.05.2019:

Bachelor Mathe, 1.0
Einstiegsgehalt all in 92k, Dax30 im Bereich künstliche Intelligenz. 38 Stunden Woche :)

Mittlerweile 130k. Bin super zufrieden, alter jetzt 25

1/10 und jetzt wieder ab in die Bib.

Ne ist schon richtig so. Stimmt aber dass der Begriff rumgeworfen wie sonst was, wir bauen für das Unternehmen selbst packages die die Fachbereiche dann anwenden dürfen. Ist also nichts mit scala oder SAS arbeiten.

Ansonsten hab ich 2 Jahre während des Studiums eben schon bei einer Versicherung gearbeitet, Einstiegsgehalt war dann 77 fix, 20 bonus.
Angefangen hat in der Abteilung keiner unter 70.

antworten
el3333

Data Scientist

WiWi Gast schrieb am 12.05.2019:

Bachelor Mathe, 1.0
Einstiegsgehalt all in 92k, Dax30 im Bereich künstliche Intelligenz. 38 Stunden Woche :)

Mittlerweile 130k. Bin super zufrieden, alter jetzt 25

1/10 und jetzt wieder ab in die Bib.

Ne ist schon richtig so. Stimmt aber dass der Begriff rumgeworfen wie sonst was, wir bauen für das Unternehmen selbst packages die die Fachbereiche dann anwenden dürfen. Ist also nichts mit scala oder SAS arbeiten.

Ansonsten hab ich 2 Jahre während des Studiums eben schon bei einer Versicherung gearbeitet, Einstiegsgehalt war dann 77 fix, 20 bonus.
Angefangen hat in der Abteilung keiner unter 70.

Bei welchem DAX30 Unternehmen bekommt man bitte 92k nach dem Bachelor?? Sag mir das, ich bewerb mich gleich.

antworten
WiWi Gast

Data Scientist

el3333 schrieb am 12.05.2019:

WiWi Gast schrieb am 12.05.2019:

Bachelor Mathe, 1.0
Einstiegsgehalt all in 92k, Dax30 im Bereich künstliche Intelligenz. 38 Stunden Woche :)

Mittlerweile 130k. Bin super zufrieden, alter jetzt 25

1/10 und jetzt wieder ab in die Bib.

Ne ist schon richtig so. Stimmt aber dass der Begriff rumgeworfen wie sonst was, wir bauen für das Unternehmen selbst packages die die Fachbereiche dann anwenden dürfen. Ist also nichts mit scala oder SAS arbeiten.

Ansonsten hab ich 2 Jahre während des Studiums eben schon bei einer Versicherung gearbeitet, Einstiegsgehalt war dann 77 fix, 20 bonus.
Angefangen hat in der Abteilung keiner unter 70.

Bei welchem DAX30 Unternehmen bekommt man bitte 92k nach dem Bachelor?? Sag mir das, ich bewerb mich gleich.

BMW. Entwickle ne ganz spezielle Klasse an neuronalen Netzen die eben in dem Bereich gefragt sind. Haben da auf Stellen oftmals nur 1-2 passende Bewerber (bekomme den Prozess ja mittlerweile mit) und die sind dann sehr gefragt. Klar ist das eine kleine Nische, aber dennoch muss sie gefüllt werden. Und naja, das Fixgehalt waren ja auch nur 77. 20% Bonus gabs aber eben :)

antworten
WiWi Gast

Data Scientist

Die die das Fahren automatisieren und die es versichern.

el3333 schrieb am 12.05.2019:

WiWi Gast schrieb am 12.05.2019:

Bachelor Mathe, 1.0
Einstiegsgehalt all in 92k, Dax30 im Bereich künstliche Intelligenz. 38 Stunden Woche :)

Mittlerweile 130k. Bin super zufrieden, alter jetzt 25

1/10 und jetzt wieder ab in die Bib.

Ne ist schon richtig so. Stimmt aber dass der Begriff rumgeworfen wie sonst was, wir bauen für das Unternehmen selbst packages die die Fachbereiche dann anwenden dürfen. Ist also nichts mit scala oder SAS arbeiten.

Ansonsten hab ich 2 Jahre während des Studiums eben schon bei einer Versicherung gearbeitet, Einstiegsgehalt war dann 77 fix, 20 bonus.
Angefangen hat in der Abteilung keiner unter 70.

Bei welchem DAX30 Unternehmen bekommt man bitte 92k nach dem Bachelor?? Sag mir das, ich bewerb mich gleich.

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 08.01.2019:

Alles was R, SAS oder sogar Excel verwendet bezeichnet sich heute als Data Scientist, weil das Berufsbild so unklar definiert ist und hip klingt. Die meisten sind allerdings Analysten. Wenn jemand kein Python kann, ist die Wahrscheinlichkeit hoch, dass er kein Data Scientist ist, sondern eher Statistiker oder Analyst.

Wieso sollte Python die exclusive Programmiersprache für DS sein? Alles was nicht Bildverarbeitung und NLP ist, kann locker und zum teil viel besser in R gemacht werden. Viele denken wohl, dass DS nur daraus besteht möglichst 'deepe' Neuronale Netze für die trivialsten Aufgabenstellungen zu basteln.

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 08.01.2019:

Alles was R, SAS oder sogar Excel verwendet bezeichnet sich heute als Data Scientist, weil das Berufsbild so unklar definiert ist und hip klingt. Die meisten sind allerdings Analysten. Wenn jemand kein Python kann, ist die Wahrscheinlichkeit hoch, dass er kein Data Scientist ist, sondern eher Statistiker oder Analyst.

Python kann alles, ist aber nirgendwo die beste Programmiersprache. Außerhalb neuronaler Netze ist der Workflow in R um ein vielfaches effizienter als in Python. Von Visualisierung, Reporting und Co. ganz zu schweigen. Das man dann kein Data Scientist sein soll ist eher ein Kompliment bzw. ein großer Kompetenzvorteil. Ein Statistiker mit etwas Informatikkenntnissen ist de facto ein oder der bessere Data Scientist formal gesehen, da Data Science nichts anderes als Statistik in einem neuen Gewandt. Lineare Regression wir halt als ,,Supervised Learning" ausgegeben. 90% der "Machine Learning Algorithmen" wurden de facto von Statistikern selbst erfunden: Random Forest, Bagging, CART = Leo Breiman, Bootstrap = Bradley Efron oder ganz praktisch ein simpler Boxplot (uvm!) von J. Tukey.

Was euch hier aus eigener Studien-, Lebens- und Berufserfahrung mitgeben möchte:

  • Folgt nicht jedem Hype,
  • denkt für euch selbst
  • lernt die Basics wie Statistik und Informatik
  • Data Science Studiengänge mit vorsicht genießen und genau in das Studienhandbuch schauen
  • lasst euch nicht von BWLern und WiWis erklären was euer Fach ist
  • Nicht R vs. Python sondern R UND Python! (Und SQL)
  • Lernt die Dinge einfach an Dritte zu vermitteln
  • (Angewandte) Statistiker (M.Sc.) oder Informatiker mit guten Statistik Kenntnissen sind vielen DS Absolventen vorzuziehen da: a) Basics vorhanden, b) Mathematik vorhanden.
  • Falls man reines DS studieren möchte bitte die 5-8% der gut strukturierten und aufgebauten Studiengänge wählen. Uni vs. FH interessiert keinen mehr (musste ich auch erstmal lernen das ich nicht über FH'ler stehe)
  • weniger WiWi-Treff sondern Praxiserfahrung sammeln.
antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 01.09.2023:

Alles was R, SAS oder sogar Excel verwendet bezeichnet sich heute als Data Scientist, weil das Berufsbild so unklar definiert ist und hip klingt. Die meisten sind allerdings Analysten. Wenn jemand kein Python kann, ist die Wahrscheinlichkeit hoch, dass er kein Data Scientist ist, sondern eher Statistiker oder Analyst.

Python kann alles, ist aber nirgendwo die beste Programmiersprache. Außerhalb neuronaler Netze ist der Workflow in R um ein vielfaches effizienter als in Python. Von Visualisierung, Reporting und Co. ganz zu schweigen. Das man dann kein Data Scientist sein soll ist eher ein Kompliment bzw. ein großer Kompetenzvorteil. Ein Statistiker mit etwas Informatikkenntnissen ist de facto ein oder der bessere Data Scientist formal gesehen, da Data Science nichts anderes als Statistik in einem neuen Gewandt. Lineare Regression wir halt als ,,Supervised Learning" ausgegeben. 90% der "Machine Learning Algorithmen" wurden de facto von Statistikern selbst erfunden: Random Forest, Bagging, CART = Leo Breiman, Bootstrap = Bradley Efron oder ganz praktisch ein simpler Boxplot (uvm!) von J. Tukey.

Was euch hier aus eigener Studien-, Lebens- und Berufserfahrung mitgeben möchte:

  • Folgt nicht jedem Hype,
  • denkt für euch selbst
  • lernt die Basics wie Statistik und Informatik
  • Data Science Studiengänge mit vorsicht genießen und genau in das Studienhandbuch schauen
  • lasst euch nicht von BWLern und WiWis erklären was euer Fach ist
  • Nicht R vs. Python sondern R UND Python! (Und SQL)
  • Lernt die Dinge einfach an Dritte zu vermitteln
  • (Angewandte) Statistiker (M.Sc.) oder Informatiker mit guten Statistik Kenntnissen sind vielen DS Absolventen vorzuziehen da: a) Basics vorhanden, b) Mathematik vorhanden.
  • Falls man reines DS studieren möchte bitte die 5-8% der gut strukturierten und aufgebauten Studiengänge wählen. Uni vs. FH interessiert keinen mehr (musste ich auch erstmal lernen das ich nicht über FH'ler stehe)
  • weniger WiWi-Treff sondern Praxiserfahrung sammeln.

Das ist leider Quatsch. Wir reden hier um Data Science und nicht Statistik. Das Feld ist eben so groß und erfolgreich geworden, weil eben Neuronale Netze (leider) fast alle bisherigen statistischen Methoden schlagen.

R ist für Statistik. Das ist das "alte Zeug" welches eig. sich in den letzten 20 Jahren kaum entwickelt hat.
Data Science hingegen und dazu zähle ich auch Machine Learning hat bereits einige Revolutionen hervorgebracht, siehe ChatGPT, Sprachübersetzung, generative Modelle, etc. pp.

Was man häufig sieht, ist das "langweilige" statistik Jobs, wie z.B. Aktuar plötzlich als Data Science beschrieben werden. Naja kann man machen, ist aber im Grunde der gleiche Job wie eben vor zig Jahren. Da braucht man keine neue Berufsbezeichnung. Daher auch die Frage zum Einstiegsgehalt schwer zu beantworten, da viele Jobs wo man noch mit Excel arbeitet als "Data Science" oder auch Big Data bezeichnet werden...

antworten
WiWi Gast

Data Scientist

Man muss unterscheiden, was für ein Typ von Data Scientist man sein will. Da wird viel durcheinander geworfen:

  • Engineering: Typischerweise Machine Learning Engineer, oft aber auch immer noch als Data Scientist bezeichent. Hierfür sollte man ganz klar Informatik studieren und hier geht es um den produktiven Einsatz von Data Science, Statistik ist hier ganz nicht so relevant, auch wenn man natürlich die Grundlagen kennen muss, aber es geht eben explizit um ML, oftmals auch um morderne KI. (Python/andere Sprachen)

  • Product Data Science: Hier geht es um Auswertungen, Business und Testing. Hier braucht man Statistik und vermutlich ist das auch die beste Studien-Wahl für den Job. Geht selten über Lineare Regression hinaus, was ML angeht und KI spielt meist keine Rolle. Hat einen großen Business Fokus und würde ich auch eher als Business Analyst sehen, als als Data Scientist. (R/Python/Excel)

  • Data Analyst: Ähnlich wie der Product Data Scientist, aber eher auf Reporting, Dashboards und Visualisierung ausgerichtet. (Excel)

  • Research Scientist: Der "original" data scientist, der wirklich ganz tief in die Methodik abtaucht, neue machine Learning Modelle entwicklet und sich auf die Modellierung konzentriert. Ist eben eher Forschung. Meistens PhDs.
antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 01.09.2023:

Alles was R, SAS oder sogar Excel verwendet bezeichnet sich heute als Data Scientist, weil das Berufsbild so unklar definiert ist und hip klingt. Die meisten sind allerdings Analysten. Wenn jemand kein Python kann, ist die Wahrscheinlichkeit hoch, dass er kein Data Scientist ist, sondern eher Statistiker oder Analyst.

Python kann alles, ist aber nirgendwo die beste Programmiersprache. Außerhalb neuronaler Netze ist der Workflow in R um ein vielfaches effizienter als in Python. Von Visualisierung, Reporting und Co. ganz zu schweigen. Das man dann kein Data Scientist sein soll ist eher ein Kompliment bzw. ein großer Kompetenzvorteil. Ein Statistiker mit etwas Informatikkenntnissen ist de facto ein oder der bessere Data Scientist formal gesehen, da Data Science nichts anderes als Statistik in einem neuen Gewandt. Lineare Regression wir halt als ,,Supervised Learning" ausgegeben. 90% der "Machine Learning Algorithmen" wurden de facto von Statistikern selbst erfunden: Random Forest, Bagging, CART = Leo Breiman, Bootstrap = Bradley Efron oder ganz praktisch ein simpler Boxplot (uvm!) von J. Tukey.

Was euch hier aus eigener Studien-, Lebens- und Berufserfahrung mitgeben möchte:

  • Folgt nicht jedem Hype,
  • denkt für euch selbst
  • lernt die Basics wie Statistik und Informatik
  • Data Science Studiengänge mit vorsicht genießen und genau in das Studienhandbuch schauen
  • lasst euch nicht von BWLern und WiWis erklären was euer Fach ist
  • Nicht R vs. Python sondern R UND Python! (Und SQL)
  • Lernt die Dinge einfach an Dritte zu vermitteln
  • (Angewandte) Statistiker (M.Sc.) oder Informatiker mit guten Statistik Kenntnissen sind vielen DS Absolventen vorzuziehen da: a) Basics vorhanden, b) Mathematik vorhanden.
  • Falls man reines DS studieren möchte bitte die 5-8% der gut strukturierten und aufgebauten Studiengänge wählen. Uni vs. FH interessiert keinen mehr (musste ich auch erstmal lernen das ich nicht über FH'ler stehe)
  • weniger WiWi-Treff sondern Praxiserfahrung sammeln.

Das ist leider Quatsch. Wir reden hier um Data Science und nicht Statistik. Das Feld ist eben so groß und erfolgreich geworden, weil eben Neuronale Netze (leider) fast alle bisherigen statistischen Methoden schlagen.

R ist für Statistik. Das ist das "alte Zeug" welches eig. sich in den letzten 20 Jahren kaum entwickelt hat.
Data Science hingegen und dazu zähle ich auch Machine Learning hat bereits einige Revolutionen hervorgebracht, siehe ChatGPT, Sprachübersetzung, generative Modelle, etc. pp.

Was man häufig sieht, ist das "langweilige" statistik Jobs, wie z.B. Aktuar plötzlich als Data Science beschrieben werden. Naja kann man machen, ist aber im Grunde der gleiche Job wie eben vor zig Jahren. Da braucht man keine neue Berufsbezeichnung. Daher auch die Frage zum Einstiegsgehalt schwer zu beantworten, da viele Jobs wo man noch mit Excel arbeitet als "Data Science" oder auch Big Data bezeichnet werden...

Hand auf's Herz: Hast du das aus Trotz geschrieben oder sowas? Weil selbst wenn du dich mit den Begriffen mit denen du hier um dich wirfst auskennst, wovon ich jetzt mal nicht ausgehe, müsstest du wissen, dass du dir gerade selbst widersprichst. Wirklich kein Vorwurf aber: Studienanfänger, Quereinsteiger o.ä.? Ist ja auch egal.
Wenn du mal in gängige Literatur schaust, dann kannst du das von mir oben geschilderte schnell nachvollziehen. Ein Beispiel, ganz easy für dich: Neurnonale Netze ist Statistik mit Rechenpower. Du berechnest bestimmte Gewichte. Die kommen aus der Statistik und sind z.B. einfache Regressionkoeffizienten. Wenn das Vorhersageproblem linear trennbar ist, dann wird das mit der OLS oder Maximum Likelihood Methode geschätzt. Ersteres ist ziemlich "alt" und wird heute einfach als "Machine Learning Algorithmus" verkauft.
Gleiches gilt für Bootstrap Resampling (Erfunden von Bradley Efron, Statistiker) oder den CART-Algorithmus, Bagging und den Random Forest (Leo Breiman, auch Statistiker) oder Support Vector Machines (von Vapnik, wieder Statistiker). Alles Methoden die z.T. schon in dem 70er und 80er Jahren entwickelt wurden.

Auch der Punkt mit der Statistik ist nicht korrekt. Bayesianische Verfahren (Grundlage von vielen A.I. Methoden) haben Hochkonjunktur und wurden zeitgleich zur steigenden Rechenpower mit MCMC Methoden weiterentwickelt.

Noch ein Punkt zu den Programmiersprachen und dann ist glaub ich auch gut:
R wurde tatsächlich von und für Statistiker entwickelt. Im Data Science Bereich gibt es de facto nur R und Python (ich lasse jetzt Julia und Co. mal außen vor). Python ist klasse und ich selbst nutze es täglich bei der Arbeit für bspw. Webscraping oder Skriptautomatisierungen. Python kann alles ist aber in nichts ,,der Beste". R kann alles in Data Science was Python kann. R ist auch in vielen Bereichen "mächtiger" als Python, z.B. in Datenaufbereitung, Statistik, MCMC-bayes Verfahren, Visualiserung, Reporting, Model based prediction, Dashboarding mit Shiny, uvm.

Auch die Aussage, dass Neuronale Netze alles schlagen ist höchstens auf Journalistenniveau. Es gibt immer einen Tradeoff zwischen Vorhersagegenauigkeit, Interpetierbarkeit, Rechenpower, Speicherkapazitäten, Kosten, Datenqualität, usw. und sofort. Ich empfehle dir mal, wenn du mal ins höhere Semester dann kommst, das Buch von Hastie, Tibshirani et al. An Introduction to Statistical Learning. Ist kostenlos auf deren Homepage zu haben. Dort werden verschiedene Daten Simulationen gegenübergestellt, wie z.B. eine "alte" oder "langweilige" Lineare Regression ein Neuronales Netzt schlägt ;).
Wenn du dann mal ein gefestigtes Wissen in Statistik und Stochastik hast, was ist hoffe als echter Data Scientist, dann hol dir das Buch von Efron und Hastie - Computer Age statistical Inference. Daraus beziehe ich auch viele meiner Argumente die ich hier genannt habe. Das sind die Pioniere aus Stanford die neben dem Bootstrap z.B. Lasso und Ridge Regressionen (ebenfalls aus der Statistik) entwickelt haben.

Lange Rede kurzer Sinn: Als Statistiker bist du so ziemlich am besten ausgebildet für den heutigen Data Science Beruf, um Methoden auch ggf. weiterzuentwickeln und im Detail auch zu verstehen. Programmieren müssen die Statistiker allerdings noch etwas besser lernen... das ist leider noch Mangelware.

Ich hoffe ich konnte etwas Licht ins Dunkle bringen.

antworten
WiWi Gast

Data Scientist

Data Science = Statistik + Informatik

antworten
WiWi Gast

Data Scientist

Hand auf's Herz: Hast du das aus Trotz geschrieben oder sowas? Weil selbst wenn du dich mit den Begriffen mit denen du hier um dich wirfst auskennst, wovon ich jetzt mal nicht ausgehe, müsstest du wissen, dass du dir gerade selbst widersprichst. Wirklich kein Vorwurf aber: Studienanfänger, Quereinsteiger o.ä.? Ist ja auch egal.
Wenn du mal in gängige Literatur schaust, dann kannst du das von mir oben geschilderte schnell nachvollziehen. Ein Beispiel, ganz easy für dich: Neurnonale Netze ist Statistik mit Rechenpower. Du berechnest bestimmte Gewichte. Die kommen aus der Statistik und sind z.B. einfache Regressionkoeffizienten. Wenn das Vorhersageproblem linear trennbar ist, dann wird das mit der OLS oder Maximum Likelihood Methode geschätzt. Ersteres ist ziemlich "alt" und wird heute einfach als "Machine Learning Algorithmus" verkauft.
Gleiches gilt für Bootstrap Resampling (Erfunden von Bradley Efron, Statistiker) oder den CART-Algorithmus, Bagging und den Random Forest (Leo Breiman, auch Statistiker) oder Support Vector Machines (von Vapnik, wieder Statistiker). Alles Methoden die z.T. schon in dem 70er und 80er Jahren entwickelt wurden.

Auch der Punkt mit der Statistik ist nicht korrekt. Bayesianische Verfahren (Grundlage von vielen A.I. Methoden) haben Hochkonjunktur und wurden zeitgleich zur steigenden Rechenpower mit MCMC Methoden weiterentwickelt.

Noch ein Punkt zu den Programmiersprachen und dann ist glaub ich auch gut:
R wurde tatsächlich von und für Statistiker entwickelt. Im Data Science Bereich gibt es de facto nur R und Python (ich lasse jetzt Julia und Co. mal außen vor). Python ist klasse und ich selbst nutze es täglich bei der Arbeit für bspw. Webscraping oder Skriptautomatisierungen. Python kann alles ist aber in nichts ,,der Beste". R kann alles in Data Science was Python kann. R ist auch in vielen Bereichen "mächtiger" als Python, z.B. in Datenaufbereitung, Statistik, MCMC-bayes Verfahren, Visualiserung, Reporting, Model based prediction, Dashboarding mit Shiny, uvm.

Auch die Aussage, dass Neuronale Netze alles schlagen ist höchstens auf Journalistenniveau. Es gibt immer einen Tradeoff zwischen Vorhersagegenauigkeit, Interpetierbarkeit, Rechenpower, Speicherkapazitäten, Kosten, Datenqualität, usw. und sofort. Ich empfehle dir mal, wenn du mal ins höhere Semester dann kommst, das Buch von Hastie, Tibshirani et al. An Introduction to Statistical Learning. Ist kostenlos auf deren Homepage zu haben. Dort werden verschiedene Daten Simulationen gegenübergestellt, wie z.B. eine "alte" oder "langweilige" Lineare Regression ein Neuronales Netzt schlägt ;).
Wenn du dann mal ein gefestigtes Wissen in Statistik und Stochastik hast, was ist hoffe als echter Data Scientist, dann hol dir das Buch von Efron und Hastie - Computer Age statistical Inference. Daraus beziehe ich auch viele meiner Argumente die ich hier genannt habe. Das sind die Pioniere aus Stanford die neben dem Bootstrap z.B. Lasso und Ridge Regressionen (ebenfalls aus der Statistik) entwickelt haben.

Lange Rede kurzer Sinn: Als Statistiker bist du so ziemlich am besten ausgebildet für den heutigen Data Science Beruf, um Methoden auch ggf. weiterzuentwickeln und im Detail auch zu verstehen. Programmieren müssen die Statistiker allerdings noch etwas besser lernen... das ist leider noch Mangelware.

Ich hoffe ich konnte etwas Licht ins Dunkle bringen.

Bin Mathematiker und stimme dem oben geschriebenen größtenteils zu. Viele Dinge, die heute in neuem Gewand daherkommen sind getunte Versionen von bekannten statistischen Konzepten. Oben werden ja einige genannt. Allerdings muss man schon anerkennen, dass man mit der existierende Theorie den Erfolg von Neuronalen Netzen nicht vollständig erklären kann. Zum Beispiel würde man im Interpolationsregime, d.h wenn es mehr Netzwerkparameter als Datenpunkte gibt, ein völlig anderes Verhalten (deutlich mehr Overfitting) erwarten. Insbesondere in diesem Bereich zeigen Neuronale Netze aber empirisch besonders gute eigenschaften. Die Theorie hat hier keine Antworten. Auch der Vergleich zwischen Neuronalen Netzen und linearer Regression ist etwas irreführend. Lineare Regression führt auf konvexe optimierungsprobleme die (fast) immer in halbwegs guter Zeit global lösbar sind. Hingegen sind die probleme bei neuronalen Netzen fast immer nichtkonvex und nichtdifferenzierbar. Der Erfolg des Lernens hängt von der Auswahl des Optimierungsalgorithmus, der Daten und der Initialisierung ab. Auch diese Zusammenhänge sind weitesgehend unklar. Rein empirisch muss man auch festhalten, dass Neuronale Netze in vielen Problemklassen den state of the art neu definiert haben. Das mag nicht für alle praktischen Probleme relevant sein, aber für zb Sprach oder Bilderkennung führt heut fast kein Weg an neuronalen Netzen vorbei.

Ein Punkt der in der Diskussion um die beste Programmiersprache noch nicht genannt wurde ist die, dass Python ggf große Teile des Quellcodes zur Laufzeit interpretieren muss, was es unter Umständen sehr langsam macht. Gleichwohl gibt es dermaßen viele Bibliotheken in Python, die diesen Nachteil wieder wettmachen. In keiner anderen mir bekannten Sprache kann ich als Laie so bequem Daten auf die GPU schieben und algorithmen dort ausführen und ohne großen aufwand riesige Performancegewinne erzielen.

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 02.09.2023:

Hand auf's Herz: Hast du das aus Trotz geschrieben oder sowas? Weil selbst wenn du dich mit den Begriffen mit denen du hier um dich wirfst auskennst, wovon ich jetzt mal nicht ausgehe, müsstest du wissen, dass du dir gerade selbst widersprichst. Wirklich kein Vorwurf aber: Studienanfänger, Quereinsteiger o.ä.? Ist ja auch egal.
Wenn du mal in gängige Literatur schaust, dann kannst du das von mir oben geschilderte schnell nachvollziehen. Ein Beispiel, ganz easy für dich: Neurnonale Netze ist Statistik mit Rechenpower. Du berechnest bestimmte Gewichte. Die kommen aus der Statistik und sind z.B. einfache Regressionkoeffizienten. Wenn das Vorhersageproblem linear trennbar ist, dann wird das mit der OLS oder Maximum Likelihood Methode geschätzt. Ersteres ist ziemlich "alt" und wird heute einfach als "Machine Learning Algorithmus" verkauft.
Gleiches gilt für Bootstrap Resampling (Erfunden von Bradley Efron, Statistiker) oder den CART-Algorithmus, Bagging und den Random Forest (Leo Breiman, auch Statistiker) oder Support Vector Machines (von Vapnik, wieder Statistiker). Alles Methoden die z.T. schon in dem 70er und 80er Jahren entwickelt wurden.

Auch der Punkt mit der Statistik ist nicht korrekt. Bayesianische Verfahren (Grundlage von vielen A.I. Methoden) haben Hochkonjunktur und wurden zeitgleich zur steigenden Rechenpower mit MCMC Methoden weiterentwickelt.

Noch ein Punkt zu den Programmiersprachen und dann ist glaub ich auch gut:
R wurde tatsächlich von und für Statistiker entwickelt. Im Data Science Bereich gibt es de facto nur R und Python (ich lasse jetzt Julia und Co. mal außen vor). Python ist klasse und ich selbst nutze es täglich bei der Arbeit für bspw. Webscraping oder Skriptautomatisierungen. Python kann alles ist aber in nichts ,,der Beste". R kann alles in Data Science was Python kann. R ist auch in vielen Bereichen "mächtiger" als Python, z.B. in Datenaufbereitung, Statistik, MCMC-bayes Verfahren, Visualiserung, Reporting, Model based prediction, Dashboarding mit Shiny, uvm.

Auch die Aussage, dass Neuronale Netze alles schlagen ist höchstens auf Journalistenniveau. Es gibt immer einen Tradeoff zwischen Vorhersagegenauigkeit, Interpetierbarkeit, Rechenpower, Speicherkapazitäten, Kosten, Datenqualität, usw. und sofort. Ich empfehle dir mal, wenn du mal ins höhere Semester dann kommst, das Buch von Hastie, Tibshirani et al. An Introduction to Statistical Learning. Ist kostenlos auf deren Homepage zu haben. Dort werden verschiedene Daten Simulationen gegenübergestellt, wie z.B. eine "alte" oder "langweilige" Lineare Regression ein Neuronales Netzt schlägt ;).
Wenn du dann mal ein gefestigtes Wissen in Statistik und Stochastik hast, was ist hoffe als echter Data Scientist, dann hol dir das Buch von Efron und Hastie - Computer Age statistical Inference. Daraus beziehe ich auch viele meiner Argumente die ich hier genannt habe. Das sind die Pioniere aus Stanford die neben dem Bootstrap z.B. Lasso und Ridge Regressionen (ebenfalls aus der Statistik) entwickelt haben.

Lange Rede kurzer Sinn: Als Statistiker bist du so ziemlich am besten ausgebildet für den heutigen Data Science Beruf, um Methoden auch ggf. weiterzuentwickeln und im Detail auch zu verstehen. Programmieren müssen die Statistiker allerdings noch etwas besser lernen... das ist leider noch Mangelware.

Ich hoffe ich konnte etwas Licht ins Dunkle bringen.

Bin Mathematiker und stimme dem oben geschriebenen größtenteils zu. Viele Dinge, die heute in neuem Gewand daherkommen sind getunte Versionen von bekannten statistischen Konzepten. Oben werden ja einige genannt. Allerdings muss man schon anerkennen, dass man mit der existierende Theorie den Erfolg von Neuronalen Netzen nicht vollständig erklären kann. Zum Beispiel würde man im Interpolationsregime, d.h wenn es mehr Netzwerkparameter als Datenpunkte gibt, ein völlig anderes Verhalten (deutlich mehr Overfitting) erwarten. Insbesondere in diesem Bereich zeigen Neuronale Netze aber empirisch besonders gute eigenschaften. Die Theorie hat hier keine Antworten. Auch der Vergleich zwischen Neuronalen Netzen und linearer Regression ist etwas irreführend. Lineare Regression führt auf konvexe optimierungsprobleme die (fast) immer in halbwegs guter Zeit global lösbar sind. Hingegen sind die probleme bei neuronalen Netzen fast immer nichtkonvex und nichtdifferenzierbar. Der Erfolg des Lernens hängt von der Auswahl des Optimierungsalgorithmus, der Daten und der Initialisierung ab. Auch diese Zusammenhänge sind weitesgehend unklar. Rein empirisch muss man auch festhalten, dass Neuronale Netze in vielen Problemklassen den state of the art neu definiert haben. Das mag nicht für alle praktischen Probleme relevant sein, aber für zb Sprach oder Bilderkennung führt heut fast kein Weg an neuronalen Netzen vorbei.

Ein Punkt der in der Diskussion um die beste Programmiersprache noch nicht genannt wurde ist die, dass Python ggf große Teile des Quellcodes zur Laufzeit interpretieren muss, was es unter Umständen sehr langsam macht. Gleichwohl gibt es dermaßen viele Bibliotheken in Python, die diesen Nachteil wieder wettmachen. In keiner anderen mir bekannten Sprache kann ich als Laie so bequem Daten auf die GPU schieben und algorithmen dort ausführen und ohne großen aufwand riesige Performancegewinne erzielen.

Hi, ich bin der Verfasser von oben. Danke für die Ergänzungen und Anregungen. So tief bin ich dann doch nicht in's Detail gegangen. Zu deinen Punkten mit der fehlenden bzw. noch unerforschten Theorie (ich denke du deutest damit klassische Inferenz und und Theoreme aus der mathematischen Statistik an) gibt es ein tolles Paper von Leo Breiman: ,,The two Cultures" hieß das glaube ich. Dort kritisiert er die damalige Unoffenheit oder eben die starre Vorgehens- und Sichtweise von Statistikern bzgl. der Offenheit für algorithmischen Herangehensweisen, Black-Box-Ansätze und Co.

Python ist super wie gesagt. Gleiche Bibliotheken gibt es allerdings auch für R. Du kannst auch R Funktionen in C/C++ schreiben oder Berechnungen bequem parallel über mehrere Kerne laufen lassen, wenn dies möglich ist. Durch die immer besser werdende Rechenleistung der Computer wird auf all das sowieso immer weniger geachtet. Die eine beste Programmiersprache gibt es sowieso nicht.

Der Punkt mit der Anzahl der Parameter > Daten oder Variablen ist der steigenden Trainingszeit eines Netzes zu verdanken. Erinnerung und stochastische Zuteilung von Startwerten z.B. werden bei erhöhter Lernzeit gepaart mit den hinzukommenden Datenströmen immer besser. Bewiesen ist dazu in der Literatur allerdings noch garnichts. Zumindest konnte ich bisher nur Hypothesen und numerische Simulationen finden. Ich denke das meintest du auch weiter oben, dass das Feld sehr offen gerade ist in der Hinsicht.

Wird den Studenten in einem spezialisierten Data Science Studium (o.ä.) all diese Punkte vermittelt? Bzw. konkreter formuliert: Werden den Studenten dort die nötigen mathematischen Werkzeuge vermittelt, die zum selbständigen Bearbeiten und Verstehen derartiger Sachverhalte helfen? Wenn das Ergebnis der Beitrag von der Person, der ich zuvor geantwortet hatte, sein soll dann würde ich eher auf ,,Nein" schließen...

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 01.09.2023:

Alles was R, SAS oder sogar Excel verwendet bezeichnet sich heute als Data Scientist, weil das Berufsbild so unklar definiert ist und hip klingt. Die meisten sind allerdings Analysten. Wenn jemand kein Python kann, ist die Wahrscheinlichkeit hoch, dass er kein Data Scientist ist, sondern eher Statistiker oder Analyst.

Python kann alles, ist aber nirgendwo die beste Programmiersprache. Außerhalb neuronaler Netze ist der Workflow in R um ein vielfaches effizienter als in Python. Von Visualisierung, Reporting und Co. ganz zu schweigen. Das man dann kein Data Scientist sein soll ist eher ein Kompliment bzw. ein großer Kompetenzvorteil. Ein Statistiker mit etwas Informatikkenntnissen ist de facto ein oder der bessere Data Scientist formal gesehen, da Data Science nichts anderes als Statistik in einem neuen Gewandt. Lineare Regression wir halt als ,,Supervised Learning" ausgegeben. 90% der "Machine Learning Algorithmen" wurden de facto von Statistikern selbst erfunden: Random Forest, Bagging, CART = Leo Breiman, Bootstrap = Bradley Efron oder ganz praktisch ein simpler Boxplot (uvm!) von J. Tukey.

Was euch hier aus eigener Studien-, Lebens- und Berufserfahrung mitgeben möchte:

  • Folgt nicht jedem Hype,
  • denkt für euch selbst
  • lernt die Basics wie Statistik und Informatik
  • Data Science Studiengänge mit vorsicht genießen und genau in das Studienhandbuch schauen
  • lasst euch nicht von BWLern und WiWis erklären was euer Fach ist
  • Nicht R vs. Python sondern R UND Python! (Und SQL)
  • Lernt die Dinge einfach an Dritte zu vermitteln
  • (Angewandte) Statistiker (M.Sc.) oder Informatiker mit guten Statistik Kenntnissen sind vielen DS Absolventen vorzuziehen da: a) Basics vorhanden, b) Mathematik vorhanden.
  • Falls man reines DS studieren möchte bitte die 5-8% der gut strukturierten und aufgebauten Studiengänge wählen. Uni vs. FH interessiert keinen mehr (musste ich auch erstmal lernen das ich nicht über FH'ler stehe)
  • weniger WiWi-Treff sondern Praxiserfahrung sammeln.

Das ist leider Quatsch. Wir reden hier um Data Science und nicht Statistik. Das Feld ist eben so groß und erfolgreich geworden, weil eben Neuronale Netze (leider) fast alle bisherigen statistischen Methoden schlagen.

R ist für Statistik. Das ist das "alte Zeug" welches eig. sich in den letzten 20 Jahren kaum entwickelt hat.
Data Science hingegen und dazu zähle ich auch Machine Learning hat bereits einige Revolutionen hervorgebracht, siehe ChatGPT, Sprachübersetzung, generative Modelle, etc. pp.

Was man häufig sieht, ist das "langweilige" statistik Jobs, wie z.B. Aktuar plötzlich als Data Science beschrieben werden. Naja kann man machen, ist aber im Grunde der gleiche Job wie eben vor zig Jahren. Da braucht man keine neue Berufsbezeichnung. Daher auch die Frage zum Einstiegsgehalt schwer zu beantworten, da viele Jobs wo man noch mit Excel arbeitet als "Data Science" oder auch Big Data bezeichnet werden...

Hand auf's Herz: Hast du das aus Trotz geschrieben oder sowas? Weil selbst wenn du dich mit den Begriffen mit denen du hier um dich wirfst auskennst, wovon ich jetzt mal nicht ausgehe, müsstest du wissen, dass du dir gerade selbst widersprichst. Wirklich kein Vorwurf aber: Studienanfänger, Quereinsteiger o.ä.? Ist ja auch egal.
Wenn du mal in gängige Literatur schaust, dann kannst du das von mir oben geschilderte schnell nachvollziehen. Ein Beispiel, ganz easy für dich: Neurnonale Netze ist Statistik mit Rechenpower. Du berechnest bestimmte Gewichte. Die kommen aus der Statistik und sind z.B. einfache Regressionkoeffizienten. Wenn das Vorhersageproblem linear trennbar ist, dann wird das mit der OLS oder Maximum Likelihood Methode geschätzt. Ersteres ist ziemlich "alt" und wird heute einfach als "Machine Learning Algorithmus" verkauft.
Gleiches gilt für Bootstrap Resampling (Erfunden von Bradley Efron, Statistiker) oder den CART-Algorithmus, Bagging und den Random Forest (Leo Breiman, auch Statistiker) oder Support Vector Machines (von Vapnik, wieder Statistiker). Alles Methoden die z.T. schon in dem 70er und 80er Jahren entwickelt wurden.

Auch der Punkt mit der Statistik ist nicht korrekt. Bayesianische Verfahren (Grundlage von vielen A.I. Methoden) haben Hochkonjunktur und wurden zeitgleich zur steigenden Rechenpower mit MCMC Methoden weiterentwickelt.

Noch ein Punkt zu den Programmiersprachen und dann ist glaub ich auch gut:
R wurde tatsächlich von und für Statistiker entwickelt. Im Data Science Bereich gibt es de facto nur R und Python (ich lasse jetzt Julia und Co. mal außen vor). Python ist klasse und ich selbst nutze es täglich bei der Arbeit für bspw. Webscraping oder Skriptautomatisierungen. Python kann alles ist aber in nichts ,,der Beste". R kann alles in Data Science was Python kann. R ist auch in vielen Bereichen "mächtiger" als Python, z.B. in Datenaufbereitung, Statistik, MCMC-bayes Verfahren, Visualiserung, Reporting, Model based prediction, Dashboarding mit Shiny, uvm.

Auch die Aussage, dass Neuronale Netze alles schlagen ist höchstens auf Journalistenniveau. Es gibt immer einen Tradeoff zwischen Vorhersagegenauigkeit, Interpetierbarkeit, Rechenpower, Speicherkapazitäten, Kosten, Datenqualität, usw. und sofort. Ich empfehle dir mal, wenn du mal ins höhere Semester dann kommst, das Buch von Hastie, Tibshirani et al. An Introduction to Statistical Learning. Ist kostenlos auf deren Homepage zu haben. Dort werden verschiedene Daten Simulationen gegenübergestellt, wie z.B. eine "alte" oder "langweilige" Lineare Regression ein Neuronales Netzt schlägt ;).
Wenn du dann mal ein gefestigtes Wissen in Statistik und Stochastik hast, was ist hoffe als echter Data Scientist, dann hol dir das Buch von Efron und Hastie - Computer Age statistical Inference. Daraus beziehe ich auch viele meiner Argumente die ich hier genannt habe. Das sind die Pioniere aus Stanford die neben dem Bootstrap z.B. Lasso und Ridge Regressionen (ebenfalls aus der Statistik) entwickelt haben.

Lange Rede kurzer Sinn: Als Statistiker bist du so ziemlich am besten ausgebildet für den heutigen Data Science Beruf, um Methoden auch ggf. weiterzuentwickeln und im Detail auch zu verstehen. Programmieren müssen die Statistiker allerdings noch etwas besser lernen... das ist leider noch Mangelware.

Ich hoffe ich konnte etwas Licht ins Dunkle bringen.

Gut zusammengefasst! Teile deine Sichtweisen

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 01.09.2023:

Alles was R, SAS oder sogar Excel verwendet bezeichnet sich heute als Data Scientist, weil das Berufsbild so unklar definiert ist und hip klingt. Die meisten sind allerdings Analysten. Wenn jemand kein Python kann, ist die Wahrscheinlichkeit hoch, dass er kein Data Scientist ist, sondern eher Statistiker oder Analyst.

Python kann alles, ist aber nirgendwo die beste Programmiersprache. Außerhalb neuronaler Netze ist der Workflow in R um ein vielfaches effizienter als in Python. Von Visualisierung, Reporting und Co. ganz zu schweigen. Das man dann kein Data Scientist sein soll ist eher ein Kompliment bzw. ein großer Kompetenzvorteil. Ein Statistiker mit etwas Informatikkenntnissen ist de facto ein oder der bessere Data Scientist formal gesehen, da Data Science nichts anderes als Statistik in einem neuen Gewandt. Lineare Regression wir halt als ,,Supervised Learning" ausgegeben. 90% der "Machine Learning Algorithmen" wurden de facto von Statistikern selbst erfunden: Random Forest, Bagging, CART = Leo Breiman, Bootstrap = Bradley Efron oder ganz praktisch ein simpler Boxplot (uvm!) von J. Tukey.

Was euch hier aus eigener Studien-, Lebens- und Berufserfahrung mitgeben möchte:

  • Folgt nicht jedem Hype,
  • denkt für euch selbst
  • lernt die Basics wie Statistik und Informatik
  • Data Science Studiengänge mit vorsicht genießen und genau in das Studienhandbuch schauen
  • lasst euch nicht von BWLern und WiWis erklären was euer Fach ist
  • Nicht R vs. Python sondern R UND Python! (Und SQL)
  • Lernt die Dinge einfach an Dritte zu vermitteln
  • (Angewandte) Statistiker (M.Sc.) oder Informatiker mit guten Statistik Kenntnissen sind vielen DS Absolventen vorzuziehen da: a) Basics vorhanden, b) Mathematik vorhanden.
  • Falls man reines DS studieren möchte bitte die 5-8% der gut strukturierten und aufgebauten Studiengänge wählen. Uni vs. FH interessiert keinen mehr (musste ich auch erstmal lernen das ich nicht über FH'ler stehe)
  • weniger WiWi-Treff sondern Praxiserfahrung sammeln.

Das ist leider Quatsch. Wir reden hier um Data Science und nicht Statistik. Das Feld ist eben so groß und erfolgreich geworden, weil eben Neuronale Netze (leider) fast alle bisherigen statistischen Methoden schlagen.

R ist für Statistik. Das ist das "alte Zeug" welches eig. sich in den letzten 20 Jahren kaum entwickelt hat.
Data Science hingegen und dazu zähle ich auch Machine Learning hat bereits einige Revolutionen hervorgebracht, siehe ChatGPT, Sprachübersetzung, generative Modelle, etc. pp.

Was man häufig sieht, ist das "langweilige" statistik Jobs, wie z.B. Aktuar plötzlich als Data Science beschrieben werden. Naja kann man machen, ist aber im Grunde der gleiche Job wie eben vor zig Jahren. Da braucht man keine neue Berufsbezeichnung. Daher auch die Frage zum Einstiegsgehalt schwer zu beantworten, da viele Jobs wo man noch mit Excel arbeitet als "Data Science" oder auch Big Data bezeichnet werden...

Hand auf's Herz: Hast du das aus Trotz geschrieben oder sowas? Weil selbst wenn du dich mit den Begriffen mit denen du hier um dich wirfst auskennst, wovon ich jetzt mal nicht ausgehe, müsstest du wissen, dass du dir gerade selbst widersprichst. Wirklich kein Vorwurf aber: Studienanfänger, Quereinsteiger o.ä.? Ist ja auch egal.
Wenn du mal in gängige Literatur schaust, dann kannst du das von mir oben geschilderte schnell nachvollziehen. Ein Beispiel, ganz easy für dich: Neurnonale Netze ist Statistik mit Rechenpower. Du berechnest bestimmte Gewichte. Die kommen aus der Statistik und sind z.B. einfache Regressionkoeffizienten. Wenn das Vorhersageproblem linear trennbar ist, dann wird das mit der OLS oder Maximum Likelihood Methode geschätzt. Ersteres ist ziemlich "alt" und wird heute einfach als "Machine Learning Algorithmus" verkauft.
Gleiches gilt für Bootstrap Resampling (Erfunden von Bradley Efron, Statistiker) oder den CART-Algorithmus, Bagging und den Random Forest (Leo Breiman, auch Statistiker) oder Support Vector Machines (von Vapnik, wieder Statistiker). Alles Methoden die z.T. schon in dem 70er und 80er Jahren entwickelt wurden.

Auch der Punkt mit der Statistik ist nicht korrekt. Bayesianische Verfahren (Grundlage von vielen A.I. Methoden) haben Hochkonjunktur und wurden zeitgleich zur steigenden Rechenpower mit MCMC Methoden weiterentwickelt.

Noch ein Punkt zu den Programmiersprachen und dann ist glaub ich auch gut:
R wurde tatsächlich von und für Statistiker entwickelt. Im Data Science Bereich gibt es de facto nur R und Python (ich lasse jetzt Julia und Co. mal außen vor). Python ist klasse und ich selbst nutze es täglich bei der Arbeit für bspw. Webscraping oder Skriptautomatisierungen. Python kann alles ist aber in nichts ,,der Beste". R kann alles in Data Science was Python kann. R ist auch in vielen Bereichen "mächtiger" als Python, z.B. in Datenaufbereitung, Statistik, MCMC-bayes Verfahren, Visualiserung, Reporting, Model based prediction, Dashboarding mit Shiny, uvm.

Auch die Aussage, dass Neuronale Netze alles schlagen ist höchstens auf Journalistenniveau. Es gibt immer einen Tradeoff zwischen Vorhersagegenauigkeit, Interpetierbarkeit, Rechenpower, Speicherkapazitäten, Kosten, Datenqualität, usw. und sofort. Ich empfehle dir mal, wenn du mal ins höhere Semester dann kommst, das Buch von Hastie, Tibshirani et al. An Introduction to Statistical Learning. Ist kostenlos auf deren Homepage zu haben. Dort werden verschiedene Daten Simulationen gegenübergestellt, wie z.B. eine "alte" oder "langweilige" Lineare Regression ein Neuronales Netzt schlägt ;).
Wenn du dann mal ein gefestigtes Wissen in Statistik und Stochastik hast, was ist hoffe als echter Data Scientist, dann hol dir das Buch von Efron und Hastie - Computer Age statistical Inference. Daraus beziehe ich auch viele meiner Argumente die ich hier genannt habe. Das sind die Pioniere aus Stanford die neben dem Bootstrap z.B. Lasso und Ridge Regressionen (ebenfalls aus der Statistik) entwickelt haben.

Lange Rede kurzer Sinn: Als Statistiker bist du so ziemlich am besten ausgebildet für den heutigen Data Science Beruf, um Methoden auch ggf. weiterzuentwickeln und im Detail auch zu verstehen. Programmieren müssen die Statistiker allerdings noch etwas besser lernen... das ist leider noch Mangelware.

Ich hoffe ich konnte etwas Licht ins Dunkle bringen.

War der Author. Kann das gleiche behaupten und dich Mal fragen ob du jetzt ein Wiki Artikel zitierst oder dein "Wissen" aus dem Buch von Bradly Efron entnommen hast. Ja, akademisch wird das Zeug so gelehrt. Weil die klassischen Methoden mehr Theorie bieten und durchaus schönere theoretische Ergebnisse liefern. Bei einem kleinen Datensatz funktioniert das Zeug auch meist besser als NN. ABER und hier das großer ABER, das Zeug ist im Moment so gut implementiert, dass da auch ein Wiwi locker ran kann. Bist evtl. Student oder Akademiker der noch nie in seinem Leben mit einem Datensatz größer als ein 1TB gearbeitet hat?

Wie gesagt das heiße Zeug, wofür auch Gehälter über 200k oder mehr bezahlt werden ist das Beschriebene EBEN NICHT. Weil es im Prinzip so "einfach" ist und die Theorie im Prinzip gut funktioniert. Nur skaliert das Zeug nicht. Du hast da so viel Begriffe reingeschmissen, dass es schwer ist darauf zu antworten. Auch MCMC-bayes ist z.B. hoch exotisch und ich würde mich wundern wenn es irgendwo (außer ner Niche) in Produktion verwendet wird. Aktuell ist Rechenpower der limitierender Fakor (Siehe Aktien Kurs Nvidia). Das Ganze Feld bewegt sich eben überhaupt nicht in die theoretische Richtung, sondern eher number crunching und gutes Verständnis von NN.

antworten
WiWi Gast

Data Scientist

Hey,

B.Sc. angewandte Informatik, 3 Jahre Berufserfahrung, Unternehmensgröße >20k , Gehalt 86k allerdings mit Sonderzahlungen.

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 19.09.2023:

Hey,

B.Sc. angewandte Informatik, 3 Jahre Berufserfahrung, Unternehmensgröße >20k , Gehalt 86k allerdings mit Sonderzahlungen.

Kannst du auch etwas zu deinem Arbeitsaltag sagen? Das wäre super :)

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 24.09.2023:

Hey,

B.Sc. angewandte Informatik, 3 Jahre Berufserfahrung, Unternehmensgröße >20k , Gehalt 86k allerdings mit Sonderzahlungen.

Kannst du auch etwas zu deinem Arbeitsaltag sagen? Das wäre super :)

Push

antworten
WiWi Gast

Data Scientist

Ich musste 4 Monate warten bis ich meine erste Stelle bekommen habe. Einstiegsgehalt 60k (inkl. Variable Zahlung) mit einer 40h Woche. Studiert habe ich Statistik im Master und BWL im Bachelor. Im Master zwei Jahre als HiWi gearbeitet und ein 6 Monatiges Praktikum im Bereich Data Science. Unternehmsgröße ca. 10000 Mitarbeiter

Zufrieden bin ich da nicht, wenn ich das mit einigen Kommilitonen vergleiche die z.T. mit 75k bis 80k eingestiegen sind (Pharma, IT)

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 27.09.2023:

Ich musste 4 Monate warten bis ich meine erste Stelle bekommen habe. Einstiegsgehalt 60k (inkl. Variable Zahlung) mit einer 40h Woche. Studiert habe ich Statistik im Master und BWL im Bachelor. Im Master zwei Jahre als HiWi gearbeitet und ein 6 Monatiges Praktikum im Bereich Data Science. Unternehmsgröße ca. 10000 Mitarbeiter

Zufrieden bin ich da nicht, wenn ich das mit einigen Kommilitonen vergleiche die z.T. mit 75k bis 80k eingestiegen sind (Pharma, IT)

Ich habe 2020 sogar mit 53k für das erste halbe Jahr angefangen.

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 05.09.2023:

Alles was R, SAS oder sogar Excel verwendet bezeichnet sich heute als Data Scientist, weil das Berufsbild so unklar definiert ist und hip klingt. Die meisten sind allerdings Analysten. Wenn jemand kein Python kann, ist die Wahrscheinlichkeit hoch, dass er kein Data Scientist ist, sondern eher Statistiker oder Analyst.

Python kann alles, ist aber nirgendwo die beste Programmiersprache. Außerhalb neuronaler Netze ist der Workflow in R um ein vielfaches effizienter als in Python. Von Visualisierung, Reporting und Co. ganz zu schweigen. Das man dann kein Data Scientist sein soll ist eher ein Kompliment bzw. ein großer Kompetenzvorteil. Ein Statistiker mit etwas Informatikkenntnissen ist de facto ein oder der bessere Data Scientist formal gesehen, da Data Science nichts anderes als Statistik in einem neuen Gewandt. Lineare Regression wir halt als ,,Supervised Learning" ausgegeben. 90% der "Machine Learning Algorithmen" wurden de facto von Statistikern selbst erfunden: Random Forest, Bagging, CART = Leo Breiman, Bootstrap = Bradley Efron oder ganz praktisch ein simpler Boxplot (uvm!) von J. Tukey.

Was euch hier aus eigener Studien-, Lebens- und Berufserfahrung mitgeben möchte:

  • Folgt nicht jedem Hype,
  • denkt für euch selbst
  • lernt die Basics wie Statistik und Informatik
  • Data Science Studiengänge mit vorsicht genießen und genau in das Studienhandbuch schauen
  • lasst euch nicht von BWLern und WiWis erklären was euer Fach ist
  • Nicht R vs. Python sondern R UND Python! (Und SQL)
  • Lernt die Dinge einfach an Dritte zu vermitteln
  • (Angewandte) Statistiker (M.Sc.) oder Informatiker mit guten Statistik Kenntnissen sind vielen DS Absolventen vorzuziehen da: a) Basics vorhanden, b) Mathematik vorhanden.
  • Falls man reines DS studieren möchte bitte die 5-8% der gut strukturierten und aufgebauten Studiengänge wählen. Uni vs. FH interessiert keinen mehr (musste ich auch erstmal lernen das ich nicht über FH'ler stehe)
  • weniger WiWi-Treff sondern Praxiserfahrung sammeln.

Das ist leider Quatsch. Wir reden hier um Data Science und nicht Statistik. Das Feld ist eben so groß und erfolgreich geworden, weil eben Neuronale Netze (leider) fast alle bisherigen statistischen Methoden schlagen.

R ist für Statistik. Das ist das "alte Zeug" welches eig. sich in den letzten 20 Jahren kaum entwickelt hat.
Data Science hingegen und dazu zähle ich auch Machine Learning hat bereits einige Revolutionen hervorgebracht, siehe ChatGPT, Sprachübersetzung, generative Modelle, etc. pp.

Was man häufig sieht, ist das "langweilige" statistik Jobs, wie z.B. Aktuar plötzlich als Data Science beschrieben werden. Naja kann man machen, ist aber im Grunde der gleiche Job wie eben vor zig Jahren. Da braucht man keine neue Berufsbezeichnung. Daher auch die Frage zum Einstiegsgehalt schwer zu beantworten, da viele Jobs wo man noch mit Excel arbeitet als "Data Science" oder auch Big Data bezeichnet werden...

Hand auf's Herz: Hast du das aus Trotz geschrieben oder sowas? Weil selbst wenn du dich mit den Begriffen mit denen du hier um dich wirfst auskennst, wovon ich jetzt mal nicht ausgehe, müsstest du wissen, dass du dir gerade selbst widersprichst. Wirklich kein Vorwurf aber: Studienanfänger, Quereinsteiger o.ä.? Ist ja auch egal.
Wenn du mal in gängige Literatur schaust, dann kannst du das von mir oben geschilderte schnell nachvollziehen. Ein Beispiel, ganz easy für dich: Neurnonale Netze ist Statistik mit Rechenpower. Du berechnest bestimmte Gewichte. Die kommen aus der Statistik und sind z.B. einfache Regressionkoeffizienten. Wenn das Vorhersageproblem linear trennbar ist, dann wird das mit der OLS oder Maximum Likelihood Methode geschätzt. Ersteres ist ziemlich "alt" und wird heute einfach als "Machine Learning Algorithmus" verkauft.
Gleiches gilt für Bootstrap Resampling (Erfunden von Bradley Efron, Statistiker) oder den CART-Algorithmus, Bagging und den Random Forest (Leo Breiman, auch Statistiker) oder Support Vector Machines (von Vapnik, wieder Statistiker). Alles Methoden die z.T. schon in dem 70er und 80er Jahren entwickelt wurden.

Auch der Punkt mit der Statistik ist nicht korrekt. Bayesianische Verfahren (Grundlage von vielen A.I. Methoden) haben Hochkonjunktur und wurden zeitgleich zur steigenden Rechenpower mit MCMC Methoden weiterentwickelt.

Noch ein Punkt zu den Programmiersprachen und dann ist glaub ich auch gut:
R wurde tatsächlich von und für Statistiker entwickelt. Im Data Science Bereich gibt es de facto nur R und Python (ich lasse jetzt Julia und Co. mal außen vor). Python ist klasse und ich selbst nutze es täglich bei der Arbeit für bspw. Webscraping oder Skriptautomatisierungen. Python kann alles ist aber in nichts ,,der Beste". R kann alles in Data Science was Python kann. R ist auch in vielen Bereichen "mächtiger" als Python, z.B. in Datenaufbereitung, Statistik, MCMC-bayes Verfahren, Visualiserung, Reporting, Model based prediction, Dashboarding mit Shiny, uvm.

Auch die Aussage, dass Neuronale Netze alles schlagen ist höchstens auf Journalistenniveau. Es gibt immer einen Tradeoff zwischen Vorhersagegenauigkeit, Interpetierbarkeit, Rechenpower, Speicherkapazitäten, Kosten, Datenqualität, usw. und sofort. Ich empfehle dir mal, wenn du mal ins höhere Semester dann kommst, das Buch von Hastie, Tibshirani et al. An Introduction to Statistical Learning. Ist kostenlos auf deren Homepage zu haben. Dort werden verschiedene Daten Simulationen gegenübergestellt, wie z.B. eine "alte" oder "langweilige" Lineare Regression ein Neuronales Netzt schlägt ;).
Wenn du dann mal ein gefestigtes Wissen in Statistik und Stochastik hast, was ist hoffe als echter Data Scientist, dann hol dir das Buch von Efron und Hastie - Computer Age statistical Inference. Daraus beziehe ich auch viele meiner Argumente die ich hier genannt habe. Das sind die Pioniere aus Stanford die neben dem Bootstrap z.B. Lasso und Ridge Regressionen (ebenfalls aus der Statistik) entwickelt haben.

Lange Rede kurzer Sinn: Als Statistiker bist du so ziemlich am besten ausgebildet für den heutigen Data Science Beruf, um Methoden auch ggf. weiterzuentwickeln und im Detail auch zu verstehen. Programmieren müssen die Statistiker allerdings noch etwas besser lernen... das ist leider noch Mangelware.

Ich hoffe ich konnte etwas Licht ins Dunkle bringen.

War der Author. Kann das gleiche behaupten und dich Mal fragen ob du jetzt ein Wiki Artikel zitierst oder dein "Wissen" aus dem Buch von Bradly Efron entnommen hast. Ja, akademisch wird das Zeug so gelehrt. Weil die klassischen Methoden mehr Theorie bieten und durchaus schönere theoretische Ergebnisse liefern. Bei einem kleinen Datensatz funktioniert das Zeug auch meist besser als NN. ABER und hier das großer ABER, das Zeug ist im Moment so gut implementiert, dass da auch ein Wiwi locker ran kann. Bist evtl. Student oder Akademiker der noch nie in seinem Leben mit einem Datensatz größer als ein 1TB gearbeitet hat?

Wie gesagt das heiße Zeug, wofür auch Gehälter über 200k oder mehr bezahlt werden ist das Beschriebene EBEN NICHT. Weil es im Prinzip so "einfach" ist und die Theorie im Prinzip gut funktioniert. Nur skaliert das Zeug nicht. Du hast da so viel Begriffe reingeschmissen, dass es schwer ist darauf zu antworten. Auch MCMC-bayes ist z.B. hoch exotisch und ich würde mich wundern wenn es irgendwo (außer ner Niche) in Produktion verwendet wird. Aktuell ist Rechenpower der limitierender Fakor (Siehe Aktien Kurs Nvidia). Das Ganze Feld bewegt sich eben überhaupt nicht in die theoretische Richtung, sondern eher number crunching und gutes Verständnis von NN.

Ich finde die Argumente des vorherigen Verfassers ehrlich gesagt auch schlüssiger und auch weniger oberflächlich. Viele deiner Punkte sind am Thema vorbei geredet oder de facto falsch.

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am

Alles was R, SAS oder sogar Excel verwendet bezeichnet sich heute als Data Scientist, weil das Berufsbild so unklar definiert ist und hip klingt. Die meisten sind allerdings Analysten. Wenn jemand kein Python kann, ist die Wahrscheinlichkeit hoch, dass er kein Data Scientist ist, sondern eher Statistiker oder Analyst.

Python kann alles, ist aber nirgendwo die beste Programmiersprache. Außerhalb neuronaler Netze ist der Workflow in R um ein vielfaches effizienter als in Python. Von Visualisierung, Reporting und Co. ganz zu schweigen. Das man dann kein Data Scientist sein soll ist eher ein Kompliment bzw. ein großer Kompetenzvorteil. Ein Statistiker mit etwas Informatikkenntnissen ist de facto ein oder der bessere Data Scientist formal gesehen, da Data Science nichts anderes als Statistik in einem neuen Gewandt. Lineare Regression wir halt als ,,Supervised Learning" ausgegeben. 90% der "Machine Learning Algorithmen" wurden de facto von Statistikern selbst erfunden: Random Forest, Bagging, CART = Leo Breiman, Bootstrap = Bradley Efron oder ganz praktisch ein simpler Boxplot (uvm!) von J. Tukey.

Was euch hier aus eigener Studien-, Lebens- und Berufserfahrung mitgeben möchte:

  • Folgt nicht jedem Hype,
  • denkt für euch selbst
  • lernt die Basics wie Statistik und Informatik
  • Data Science Studiengänge mit vorsicht genießen und genau in das Studienhandbuch schauen
  • lasst euch nicht von BWLern und WiWis erklären was euer Fach ist
  • Nicht R vs. Python sondern R UND Python! (Und SQL)
  • Lernt die Dinge einfach an Dritte zu vermitteln
  • (Angewandte) Statistiker (M.Sc.) oder Informatiker mit guten Statistik Kenntnissen sind vielen DS Absolventen vorzuziehen da: a) Basics vorhanden, b) Mathematik vorhanden.
  • Falls man reines DS studieren möchte bitte die 5-8% der gut strukturierten und aufgebauten Studiengänge wählen. Uni vs. FH interessiert keinen mehr (musste ich auch erstmal lernen das ich nicht über FH'ler stehe)
  • weniger WiWi-Treff sondern Praxiserfahrung sammeln.

Das ist leider Quatsch. Wir reden hier um Data Science und nicht Statistik. Das Feld ist eben so groß und erfolgreich geworden, weil eben Neuronale Netze (leider) fast alle bisherigen statistischen Methoden schlagen.

R ist für Statistik. Das ist das "alte Zeug" welches eig. sich in den letzten 20 Jahren kaum entwickelt hat.
Data Science hingegen und dazu zähle ich auch Machine Learning hat bereits einige Revolutionen hervorgebracht, siehe ChatGPT, Sprachübersetzung, generative Modelle, etc. pp.

Was man häufig sieht, ist das "langweilige" statistik Jobs, wie z.B. Aktuar plötzlich als Data Science beschrieben werden. Naja kann man machen, ist aber im Grunde der gleiche Job wie eben vor zig Jahren. Da braucht man keine neue Berufsbezeichnung. Daher auch die Frage zum Einstiegsgehalt schwer zu beantworten, da viele Jobs wo man noch mit Excel arbeitet als "Data Science" oder auch Big Data bezeichnet werden...

Hand auf's Herz: Hast du das aus Trotz geschrieben oder sowas? Weil selbst wenn du dich mit den Begriffen mit denen du hier um dich wirfst auskennst, wovon ich jetzt mal nicht ausgehe, müsstest du wissen, dass du dir gerade selbst widersprichst. Wirklich kein Vorwurf aber: Studienanfänger, Quereinsteiger o.ä.? Ist ja auch egal.
Wenn du mal in gängige Literatur schaust, dann kannst du das von mir oben geschilderte schnell nachvollziehen. Ein Beispiel, ganz easy für dich: Neurnonale Netze ist Statistik mit Rechenpower. Du berechnest bestimmte Gewichte. Die kommen aus der Statistik und sind z.B. einfache Regressionkoeffizienten. Wenn das Vorhersageproblem linear trennbar ist, dann wird das mit der OLS oder Maximum Likelihood Methode geschätzt. Ersteres ist ziemlich "alt" und wird heute einfach als "Machine Learning Algorithmus" verkauft.
Gleiches gilt für Bootstrap Resampling (Erfunden von Bradley Efron, Statistiker) oder den CART-Algorithmus, Bagging und den Random Forest (Leo Breiman, auch Statistiker) oder Support Vector Machines (von Vapnik, wieder Statistiker). Alles Methoden die z.T. schon in dem 70er und 80er Jahren entwickelt wurden.

Auch der Punkt mit der Statistik ist nicht korrekt. Bayesianische Verfahren (Grundlage von vielen A.I. Methoden) haben Hochkonjunktur und wurden zeitgleich zur steigenden Rechenpower mit MCMC Methoden weiterentwickelt.

Noch ein Punkt zu den Programmiersprachen und dann ist glaub ich auch gut:
R wurde tatsächlich von und für Statistiker entwickelt. Im Data Science Bereich gibt es de facto nur R und Python (ich lasse jetzt Julia und Co. mal außen vor). Python ist klasse und ich selbst nutze es täglich bei der Arbeit für bspw. Webscraping oder Skriptautomatisierungen. Python kann alles ist aber in nichts ,,der Beste". R kann alles in Data Science was Python kann. R ist auch in vielen Bereichen "mächtiger" als Python, z.B. in Datenaufbereitung, Statistik, MCMC-bayes Verfahren, Visualiserung, Reporting, Model based prediction, Dashboarding mit Shiny, uvm.

Auch die Aussage, dass Neuronale Netze alles schlagen ist höchstens auf Journalistenniveau. Es gibt immer einen Tradeoff zwischen Vorhersagegenauigkeit, Interpetierbarkeit, Rechenpower, Speicherkapazitäten, Kosten, Datenqualität, usw. und sofort. Ich empfehle dir mal, wenn du mal ins höhere Semester dann kommst, das Buch von Hastie, Tibshirani et al. An Introduction to Statistical Learning. Ist kostenlos auf deren Homepage zu haben. Dort werden verschiedene Daten Simulationen gegenübergestellt, wie z.B. eine "alte" oder "langweilige" Lineare Regression ein Neuronales Netzt schlägt ;).
Wenn du dann mal ein gefestigtes Wissen in Statistik und Stochastik hast, was ist hoffe als echter Data Scientist, dann hol dir das Buch von Efron und Hastie - Computer Age statistical Inference. Daraus beziehe ich auch viele meiner Argumente die ich hier genannt habe. Das sind die Pioniere aus Stanford die neben dem Bootstrap z.B. Lasso und Ridge Regressionen (ebenfalls aus der Statistik) entwickelt haben.

Lange Rede kurzer Sinn: Als Statistiker bist du so ziemlich am besten ausgebildet für den heutigen Data Science Beruf, um Methoden auch ggf. weiterzuentwickeln und im Detail auch zu verstehen. Programmieren müssen die Statistiker allerdings noch etwas besser lernen... das ist leider noch Mangelware.

Ich hoffe ich konnte etwas Licht ins Dunkle bringen.

War der Author. Kann das gleiche behaupten und dich Mal fragen ob du jetzt ein Wiki Artikel zitierst oder dein "Wissen" aus dem Buch von Bradly Efron entnommen hast. Ja, akademisch wird das Zeug so gelehrt. Weil die klassischen Methoden mehr Theorie bieten und durchaus schönere theoretische Ergebnisse liefern. Bei einem kleinen Datensatz funktioniert das Zeug auch meist besser als NN. ABER und hier das großer ABER, das Zeug ist im Moment so gut implementiert, dass da auch ein Wiwi locker ran kann. Bist evtl. Student oder Akademiker der noch nie in seinem Leben mit einem Datensatz größer als ein 1TB gearbeitet hat?

Wie gesagt das heiße Zeug, wofür auch Gehälter über 200k oder mehr bezahlt werden ist das Beschriebene EBEN NICHT. Weil es im Prinzip so "einfach" ist und die Theorie im Prinzip gut funktioniert. Nur skaliert das Zeug nicht. Du hast da so viel Begriffe reingeschmissen, dass es schwer ist darauf zu antworten. Auch MCMC-bayes ist z.B. hoch exotisch und ich würde mich wundern wenn es irgendwo (außer ner Niche) in Produktion verwendet wird. Aktuell ist Rechenpower der limitierender Fakor (Siehe Aktien Kurs Nvidia). Das Ganze Feld bewegt sich eben überhaupt nicht in die theoretische Richtung, sondern eher number crunching und gutes Verständnis von NN.

,,Auch MCMC-bayes ist z.B. hoch exotisch und ich würde mich wundern wenn es irgendwo (außer ner Niche)"

Danke für diesen Satz. Ich werde deswegen auch nicht näher auf deinen Kommentar eingehen. Wie gesagt, lies die Bücher und beschäftigte dich mit der Thematik damit wir eine Basis für ein Gespräch haben.

antworten
WiWi Gast

Data Scientist

,,Auch MCMC-bayes ist z.B. hoch exotisch und ich würde mich wundern wenn es irgendwo (außer ner Niche)"

Danke für diesen Satz. Ich werde deswegen auch nicht näher auf deinen Kommentar eingehen. Wie gesagt, lies die Bücher und beschäftigte dich mit der Thematik damit wir eine Basis für ein Gespräch haben.

Bitte! Um Beim Thema Gehalt zu bleiben, als Experte oder gar PhD in MCMC - Bayes kriegst du vermutlich keine 500k$ Job bei google und co. Mit einem PhD in NN und deep learning, mit praktischen Kenntnissen sieht es anders aus.

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 30.09.2023:

,,Auch MCMC-bayes ist z.B. hoch exotisch und ich würde mich wundern wenn es irgendwo (außer ner Niche)"

Danke für diesen Satz. Ich werde deswegen auch nicht näher auf deinen Kommentar eingehen. Wie gesagt, lies die Bücher und beschäftigte dich mit der Thematik damit wir eine Basis für ein Gespräch haben.

Bitte! Um Beim Thema Gehalt zu bleiben, als Experte oder gar PhD in MCMC - Bayes kriegst du vermutlich keine 500k$ Job bei google und co. Mit einem PhD in NN und deep learning, mit praktischen Kenntnissen sieht es anders aus.

Hör bitte auf hier über dieses Thema zu reden. Du hast offensichtlich keinerlei Kenntnisse von der Materie noch eine Vorstellung von Gehälter in diesem Bereich. Du hast dich jetzt schon mehrfach selbst disqualifiziert mlt deinen Aussagen. Wer wenn nicht ein naiver bzw. unerfahrener Stundent benutzt sonst in einem anonymen Forum die Begriffe ,,google" und ,,500k" in einem Satz? Göttlich :D. Du weist aber schon, dass Neuronale Netze und Deep Learning bis auf wenige Feinheiten ein und das selbe sind? Da hätten mal 10min lesen ausgereicht. Und Ohne Markov Ketten und Stochastische Prozesse wirst du kein Experte in dem Gebiet werden. Also nochmal: Bücher lesen und dann erst mitreden und nicht die interessierten Leser hier mit Unwissen verunsichern.

antworten
WiWi Gast

Data Scientist

Hör bitte auf hier über dieses Thema zu reden. Du hast offensichtlich keinerlei Kenntnisse von der Materie noch eine Vorstellung von Gehälter in diesem Bereich. Du hast dich jetzt schon mehrfach selbst disqualifiziert mlt deinen Aussagen. Wer wenn nicht ein naiver bzw. unerfahrener Stundent benutzt sonst in einem anonymen Forum die Begriffe ,,google" und ,,500k" in einem Satz? Göttlich :D. Du weist aber schon, dass Neuronale Netze und Deep Learning bis auf wenige Feinheiten ein und das selbe sind? Da hätten mal 10min lesen ausgereicht. Und Ohne Markov Ketten und Stochastische Prozesse wirst du kein Experte in dem Gebiet werden. Also nochmal: Bücher lesen und dann erst mitreden und nicht die interessierten Leser hier mit Unwissen verunsichern.

Lol wir haben wohl von einander die gleiche Meinung. Jetzt kommst du noch mit stochastischen Prozessen. Ja sicher, man braucht wohl noch das ito integral um ein Experte auf dem Gebiet zu sein.
Jetzt bist du von MCMC noch auf Markov Ketten gekommen wow noch ein akademischer Begriff. Toll.

Ganz klarer Beweis, dass du wirklich keine Ahnung hast, vermutlich ein "Experte" in R und Excel bist und von der Materie, die die Leute eben Bahnbrechend finden wirklich Null Ahnung hast.

antworten
WiWi Gast

Data Scientist

Im Gegensatz zu dir scheint der andere Typ mehr als Wikipedia Überschriften gelesen zu haben

WiWi Gast schrieb am 01.10.2023:

Hör bitte auf hier über dieses Thema zu reden. Du hast offensichtlich keinerlei Kenntnisse von der Materie noch eine Vorstellung von Gehälter in diesem Bereich. Du hast dich jetzt schon mehrfach selbst disqualifiziert mlt deinen Aussagen. Wer wenn nicht ein naiver bzw. unerfahrener Stundent benutzt sonst in einem anonymen Forum die Begriffe ,,google" und ,,500k" in einem Satz? Göttlich :D. Du weist aber schon, dass Neuronale Netze und Deep Learning bis auf wenige Feinheiten ein und das selbe sind? Da hätten mal 10min lesen ausgereicht. Und Ohne Markov Ketten und Stochastische Prozesse wirst du kein Experte in dem Gebiet werden. Also nochmal: Bücher lesen und dann erst mitreden und nicht die interessierten Leser hier mit Unwissen verunsichern.

Lol wir haben wohl von einander die gleiche Meinung. Jetzt kommst du noch mit stochastischen Prozessen. Ja sicher, man braucht wohl noch das ito integral um ein Experte auf dem Gebiet zu sein.
Jetzt bist du von MCMC noch auf Markov Ketten gekommen wow noch ein akademischer Begriff. Toll.

Ganz klarer Beweis, dass du wirklich keine Ahnung hast, vermutlich ein "Experte" in R und Excel bist und von der Materie, die die Leute eben Bahnbrechend finden wirklich Null Ahnung hast.

antworten
WiWi Gast

Data Scientist

Als neutraler Beobachter ganz unterhaltsam hier. Hätte es vor 150Jahre schon den Wiwi-Treff gegeben, wäre vermutlich eine ähnliche Diskussion entbrannt.

Um revolutionäre Technologien nutzen zu können, muss man natürlich nicht zwangsweise verstehen, wie diese gebaut oder entwickelt werden. Es gibt eben Wissenschaftler und Haftwerker und in diesem Kontext nichts irreführenderes als den Begriff Data Scientist.

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 01.10.2023:

Hör bitte auf hier über dieses Thema zu reden. Du hast offensichtlich keinerlei Kenntnisse von der Materie noch eine Vorstellung von Gehälter in diesem Bereich. Du hast dich jetzt schon mehrfach selbst disqualifiziert mlt deinen Aussagen. Wer wenn nicht ein naiver bzw. unerfahrener Stundent benutzt sonst in einem anonymen Forum die Begriffe ,,google" und ,,500k" in einem Satz? Göttlich :D. Du weist aber schon, dass Neuronale Netze und Deep Learning bis auf wenige Feinheiten ein und das selbe sind? Da hätten mal 10min lesen ausgereicht. Und Ohne Markov Ketten und Stochastische Prozesse wirst du kein Experte in dem Gebiet werden. Also nochmal: Bücher lesen und dann erst mitreden und nicht die interessierten Leser hier mit Unwissen verunsichern.

Lol wir haben wohl von einander die gleiche Meinung. Jetzt kommst du noch mit stochastischen Prozessen. Ja sicher, man braucht wohl noch das ito integral um ein Experte auf dem Gebiet zu sein.
Jetzt bist du von MCMC noch auf Markov Ketten gekommen wow noch ein akademischer Begriff. Toll.

Ganz klarer Beweis, dass du wirklich keine Ahnung hast, vermutlich ein "Experte" in R und Excel bist und von der Materie, die die Leute eben Bahnbrechend finden wirklich Null Ahnung hast.

Ohje... ,,ganz klarer Beweis" sagt er. Kannst du denn mathematisch Beweisen? Ernste Frage.

Deine Aussage:
,,Jetzt bist du von MCMC noch auf Markov Ketten gekommen wow noch ein akademischer Begriff. Toll."

Meine Antwort: MCMC = Markov Chain Monte Carlo

Epic Fail :D

Lass bitte gut sein jetzt. Hier suchen Menschen z.T. ernsthafte Meinungen und Erfahrungen zu diesem interessanten Thema und keine Selbstbestätigungen o.ä. Ich habe meine Punkte ausführlich dargelegt und dazu einige Beispiele genannt. Von dir kamen bisher nichts als leere Worthülsen oder Artikelüberschriften; und selbst diese wurden nicht logisch begründet. Wenn du also schon keinen Respekt vor meinen vorherigen inhaltlichen Posts hast, weil dir denke ich schlichtweg das nötige Fachwissen dazu fehlt, um dies beurteilen bzw. übersetzen zu können, dann denke wenigstens an die interessierten Leser hier.

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 01.10.2023:

Hör bitte auf hier über dieses Thema zu reden. Du hast offensichtlich keinerlei Kenntnisse von der Materie noch eine Vorstellung von Gehälter in diesem Bereich. Du hast dich jetzt schon mehrfach selbst disqualifiziert mlt deinen Aussagen. Wer wenn nicht ein naiver bzw. unerfahrener Stundent benutzt sonst in einem anonymen Forum die Begriffe ,,google" und ,,500k" in einem Satz? Göttlich :D. Du weist aber schon, dass Neuronale Netze und Deep Learning bis auf wenige Feinheiten ein und das selbe sind? Da hätten mal 10min lesen ausgereicht. Und Ohne Markov Ketten und Stochastische Prozesse wirst du kein Experte in dem Gebiet werden. Also nochmal: Bücher lesen und dann erst mitreden und nicht die interessierten Leser hier mit Unwissen verunsichern.

Lol wir haben wohl von einander die gleiche Meinung. Jetzt kommst du noch mit stochastischen Prozessen. Ja sicher, man braucht wohl noch das ito integral um ein Experte auf dem Gebiet zu sein.
Jetzt bist du von MCMC noch auf Markov Ketten gekommen wow noch ein akademischer Begriff. Toll.

Ganz klarer Beweis, dass du wirklich keine Ahnung hast, vermutlich ein "Experte" in R und Excel bist und von der Materie, die die Leute eben Bahnbrechend finden wirklich Null Ahnung hast.

Ohje... ,,ganz klarer Beweis" sagt er. Kannst du denn mathematisch Beweisen? Ernste Frage.

Deine Aussage:
,,Jetzt bist du von MCMC noch auf Markov Ketten gekommen wow noch ein akademischer Begriff. Toll."

Meine Antwort: MCMC = Markov Chain Monte Carlo

Epic Fail :D

Lass bitte gut sein jetzt. Hier suchen Menschen z.T. ernsthafte Meinungen und Erfahrungen zu diesem interessanten Thema und keine Selbstbestätigungen o.ä. Ich habe meine Punkte ausführlich dargelegt und dazu einige Beispiele genannt. Von dir kamen bisher nichts als leere Worthülsen oder Artikelüberschriften; und selbst diese wurden nicht logisch begründet. Wenn du also schon keinen Respekt vor meinen vorherigen inhaltlichen Posts hast, weil dir denke ich schlichtweg das nötige Fachwissen dazu fehlt, um dies beurteilen bzw. übersetzen zu können, dann denke wenigstens an die interessierten Leser hier.

Ich denke auch dass es hiermit gut sein sollte. Beide Seiten konnten Ihre Punkte äußern und die Leserinnen und Leser können sich nun ihre eigene Meinung bilden. Kapitel abgeschlossen.

Was mich nun interessiert ist, welcher Anteil stärker Gewichtet: die Statistik oder die Informatik. Wie fit muss oder sollte ich in beiden Disziplinen sein

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 05.10.2023:

Was mich nun interessiert ist, welcher Anteil stärker Gewichtet: die Statistik oder die Informatik. Wie fit muss oder sollte ich in beiden Disziplinen sein

Kommt ziemlich darauf an, was für ein Data Scientist du sein willst. Das Spektrum ist ziemlich groß, weil sich so viele verschiedene Rollen "Data Scientist" nennen. Aber ich sag mal so typischerweise ist Statistik wichtiger, weil alles weitere geht dann eher in Richtung "ML Engineer".

antworten
WiWi Gast

Data Scientist

Beide Studiengänge geben dir die nötigen Grundlagen. Du musst immer dranbleiben und neues dazulernen. Und auch als Statistik Ass wird 70% deines Arbeitsalltags vermutlich Daten Aufbereiten, Säubern und Transformieren sein. Außer du hast den Luxus in einem Unternehmen zu landen, welches dezidierte Data Engineers hat :D

WiWi Gast schrieb am 06.10.2023:

Was mich nun interessiert ist, welcher Anteil stärker Gewichtet: die Statistik oder die Informatik. Wie fit muss oder sollte ich in beiden Disziplinen sein

Kommt ziemlich darauf an, was für ein Data Scientist du sein willst. Das Spektrum ist ziemlich groß, weil sich so viele verschiedene Rollen "Data Scientist" nennen. Aber ich sag mal so typischerweise ist Statistik wichtiger, weil alles weitere geht dann eher in Richtung "ML Engineer".

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 06.10.2023:

Beide Studiengänge geben dir die nötigen Grundlagen. Du musst immer dranbleiben und neues dazulernen. Und auch als Statistik Ass wird 70% deines Arbeitsalltags vermutlich Daten Aufbereiten, Säubern und Transformieren sein. Außer du hast den Luxus in einem Unternehmen zu landen, welches dezidierte Data Engineers hat :D

Was mich nun interessiert ist, welcher Anteil stärker Gewichtet: die Statistik oder die Informatik. Wie fit muss oder sollte ich in beiden Disziplinen sein

Kommt ziemlich darauf an, was für ein Data Scientist du sein willst. Das Spektrum ist ziemlich groß, weil sich so viele verschiedene Rollen "Data Scientist" nennen. Aber ich sag mal so typischerweise ist Statistik wichtiger, weil alles weitere geht dann eher in Richtung "ML Engineer".

Datenvisualisierung wird immer wichtiger und spielt eine große Rolle

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 06.10.2023:

Was mich nun interessiert ist, welcher Anteil stärker Gewichtet: die Statistik oder die Informatik. Wie fit muss oder sollte ich in beiden Disziplinen sein

Kommt ziemlich darauf an, was für ein Data Scientist du sein willst. Das Spektrum ist ziemlich groß, weil sich so viele verschiedene Rollen "Data Scientist" nennen. Aber ich sag mal so typischerweise ist Statistik wichtiger, weil alles weitere geht dann eher in Richtung "ML Engineer".

Statistik kann halt manchmal etwas abschreckend wirken. Aber auch das ist machbar

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 09.10.2023:

Was mich nun interessiert ist, welcher Anteil stärker Gewichtet: die Statistik oder die Informatik. Wie fit muss oder sollte ich in beiden Disziplinen sein

Kommt ziemlich darauf an, was für ein Data Scientist du sein willst. Das Spektrum ist ziemlich groß, weil sich so viele verschiedene Rollen "Data Scientist" nennen. Aber ich sag mal so typischerweise ist Statistik wichtiger, weil alles weitere geht dann eher in Richtung "ML Engineer".

Statistik kann halt manchmal etwas abschreckend wirken. Aber auch das ist machbar

Ich denke bei einem spezialisierten Data Science Master wird die Statistik jetzt nicht so sehr in die Tiefe gehen

antworten
WiWi Gast

Data Scientist

Pro Tipp: Schaue lieber wo gute Forschung gemacht wird, die dich aus dem Bereich interessiert. Dann kannst du tatsächlich auch was praktisches lernen. Es gibt durchaus Studiengänge wie z.B. auch Mechatronik oder Elektrotechnik, wo Fakultäten Bahnbrechendes z.B. aus dem Bereich Robotics machen. Wer da mitgearbeitet hat, kann sich praktisch als Experte in Data Science etablieren. Analog bei LLM's und anderen Themen. Data Science ist halt ein riesen Gebiet. Da kann sich sowohl Statistik, Data Science Master, Mathematik, oder Informatik eignen...

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 09.10.2023:

Pro Tipp: Schaue lieber wo gute Forschung gemacht wird, die dich aus dem Bereich interessiert. Dann kannst du tatsächlich auch was praktisches lernen. Es gibt durchaus Studiengänge wie z.B. auch Mechatronik oder Elektrotechnik, wo Fakultäten Bahnbrechendes z.B. aus dem Bereich Robotics machen. Wer da mitgearbeitet hat, kann sich praktisch als Experte in Data Science etablieren. Analog bei LLM's und anderen Themen. Data Science ist halt ein riesen Gebiet. Da kann sich sowohl Statistik, Data Science Master, Mathematik, oder Informatik eignen...

Guter Punkt! Z.B. die Uni Tübingen oder TU Darmstadt. Das sind aber Statistik und mathematische Master

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 10.10.2023:

Pro Tipp: Schaue lieber wo gute Forschung gemacht wird, die dich aus dem Bereich interessiert. Dann kannst du tatsächlich auch was praktisches lernen. Es gibt durchaus Studiengänge wie z.B. auch Mechatronik oder Elektrotechnik, wo Fakultäten Bahnbrechendes z.B. aus dem Bereich Robotics machen. Wer da mitgearbeitet hat, kann sich praktisch als Experte in Data Science etablieren. Analog bei LLM's und anderen Themen. Data Science ist halt ein riesen Gebiet. Da kann sich sowohl Statistik, Data Science Master, Mathematik, oder Informatik eignen...

Guter Punkt! Z.B. die Uni Tübingen oder TU Darmstadt. Das sind aber Statistik und mathematische Master

TU Dortmund hat den besten Statistik Lehrstuhl in Deutschland. Kann ich nur empfehlen, wenn man echtes Data Science lernen möchte.

antworten
WiWi Gast

Data Scientist

Ne, die Ehre hat immer noch die LMU, auch wenn TU Dortmund stark ist

WiWi Gast schrieb am 22.10.2023:

Pro Tipp: Schaue lieber wo gute Forschung gemacht wird, die dich aus dem Bereich interessiert. Dann kannst du tatsächlich auch was praktisches lernen. Es gibt durchaus Studiengänge wie z.B. auch Mechatronik oder Elektrotechnik, wo Fakultäten Bahnbrechendes z.B. aus dem Bereich Robotics machen. Wer da mitgearbeitet hat, kann sich praktisch als Experte in Data Science etablieren. Analog bei LLM's und anderen Themen. Data Science ist halt ein riesen Gebiet. Da kann sich sowohl Statistik, Data Science Master, Mathematik, oder Informatik eignen...

Guter Punkt! Z.B. die Uni Tübingen oder TU Darmstadt. Das sind aber Statistik und mathematische Master

TU Dortmund hat den besten Statistik Lehrstuhl in Deutschland. Kann ich nur empfehlen, wenn man echtes Data Science lernen möchte.

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 22.10.2023:

Ne, die Ehre hat immer noch die LMU, auch wenn TU Dortmund stark ist

Pro Tipp: Schaue lieber wo gute Forschung gemacht wird, die dich aus dem Bereich interessiert. Dann kannst du tatsächlich auch was praktisches lernen. Es gibt durchaus Studiengänge wie z.B. auch Mechatronik oder Elektrotechnik, wo Fakultäten Bahnbrechendes z.B. aus dem Bereich Robotics machen. Wer da mitgearbeitet hat, kann sich praktisch als Experte in Data Science etablieren. Analog bei LLM's und anderen Themen. Data Science ist halt ein riesen Gebiet. Da kann sich sowohl Statistik, Data Science Master, Mathematik, oder Informatik eignen...

Guter Punkt! Z.B. die Uni Tübingen oder TU Darmstadt. Das sind aber Statistik und mathematische Master

TU Dortmund hat den besten Statistik Lehrstuhl in Deutschland. Kann ich nur empfehlen, wenn man echtes Data Science lernen möchte.

Nope. Dortmund, da Walter Krämer. q.e.d.

antworten
WiWi Gast

Data Scientist

Würde niemals Statistik in Deutschland studieren. Dann eher NL, UK oder so

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 23.10.2023:

Würde niemals Statistik in Deutschland studieren. Dann eher NL, UK oder so

Wieso?

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 24.10.2023:

Würde niemals Statistik in Deutschland studieren. Dann eher NL, UK oder so

Wieso?

Push

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 24.10.2023:

Würde niemals Statistik in Deutschland studieren. Dann eher NL, UK oder so

Wieso?

Push

Push 2

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 24.10.2023:

Würde niemals Statistik in Deutschland studieren. Dann eher NL, UK oder so

Wieso?

Push

Push 2

Push +3

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 23.10.2023:

Würde niemals Statistik in Deutschland studieren. Dann eher NL, UK oder so

Honestly, no chance das du irgendeine Ahnung hast. Allein Mannheim und Bremen können mit Statistik glänzen. Ja sind halb den Sozialwissenschaften zugeordnet aber so what.

Im Übrigen braucht ihr ein solides Verständnis der Statistik, solide wie nachts besoffen heimkommen und dann noch ein Modell schätzen können. Der Trick ist (habe es nicht gemacht, deswegen weiß ich es aus eigener, bittere Erfahrung), an der Uni dorthin zu gehen wo es weh tut. Vermeintlich lahmes Methodenpraktikum (praktische Anwendung der Statistik) stellt sich als ein Cambrigde-gleicher Kurs mit einem Prof einem Postdoc und
lediglich Studis raus. Und as bereits im Bachelor. Alle diese 7 haben easy promoviert bzw. Jobs mit Statistikbezug bekommen.

Also -> Uni suchen wo du dich safe fühlst und vor allem die du dir leisten kannst. Besser 7 Semester an der FU Berlin konzentriert und happy als in NL 6 Semester voll hustlen und einen Berg Schulden wg. Gebühren für ausländische Studierende. Im Master würde ich sowas wie die UNC in Chapel Hill als Auslandsjahr empfehlen, alles Statistiker in dem Bums, geile Forschungsprojekte querbeet und mit der Duke Uni im Nachbarort direkt fetteste Möglichkeiten.

Sowas gibt es etliche Male in der Welt. Recherche, fragen und nicht aufgeben. Wenn man engagiert ist passieren auch mal so Sachen wie eine Summer School an einer Ivy League Uni. Einfach nur weil ein Prof. mit einem ein schöneres Leben hat. Nullchecker gibt es genügend.

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 30.10.2023:

Würde niemals Statistik in Deutschland studieren. Dann eher NL, UK oder so

Honestly, no chance das du irgendeine Ahnung hast. Allein Mannheim und Bremen können mit Statistik glänzen. Ja sind halb den Sozialwissenschaften zugeordnet aber so what.

Im Übrigen braucht ihr ein solides Verständnis der Statistik, solide wie nachts besoffen heimkommen und dann noch ein Modell schätzen können. Der Trick ist (habe es nicht gemacht, deswegen weiß ich es aus eigener, bittere Erfahrung), an der Uni dorthin zu gehen wo es weh tut. Vermeintlich lahmes Methodenpraktikum (praktische Anwendung der Statistik) stellt sich als ein Cambrigde-gleicher Kurs mit einem Prof einem Postdoc und
lediglich Studis raus. Und as bereits im Bachelor. Alle diese 7 haben easy promoviert bzw. Jobs mit Statistikbezug bekommen.

Also -> Uni suchen wo du dich safe fühlst und vor allem die du dir leisten kannst. Besser 7 Semester an der FU Berlin konzentriert und happy als in NL 6 Semester voll hustlen und einen Berg Schulden wg. Gebühren für ausländische Studierende. Im Master würde ich sowas wie die UNC in Chapel Hill als Auslandsjahr empfehlen, alles Statistiker in dem Bums, geile Forschungsprojekte querbeet und mit der Duke Uni im Nachbarort direkt fetteste Möglichkeiten.

Sowas gibt es etliche Male in der Welt. Recherche, fragen und nicht aufgeben. Wenn man engagiert ist passieren auch mal so Sachen wie eine Summer School an einer Ivy League Uni. Einfach nur weil ein Prof. mit einem ein schöneres Leben hat. Nullchecker gibt es genügend.

Stimme da zu. So viele Statistik Master (Statistik, kein Data Science) gibts in Deutschland nicht. Die sind allesamt nicht schlecht und um ein Vielfaches besser als manch andere überlaufene Studiengänge.

antworten
WiWi Gast

Data Scientist

In meinem Statistik Master in Schweden waren wir zwischen 5-15 Leuten in den Modulen. In einigen Bachelor Wahlfächern war ich sogar der einzige Student. Und kostenlos war es auch.

WiWi Gast schrieb am 31.10.2023:

Würde niemals Statistik in Deutschland studieren. Dann eher NL, UK oder so

Honestly, no chance das du irgendeine Ahnung hast. Allein Mannheim und Bremen können mit Statistik glänzen. Ja sind halb den Sozialwissenschaften zugeordnet aber so what.

Im Übrigen braucht ihr ein solides Verständnis der Statistik, solide wie nachts besoffen heimkommen und dann noch ein Modell schätzen können. Der Trick ist (habe es nicht gemacht, deswegen weiß ich es aus eigener, bittere Erfahrung), an der Uni dorthin zu gehen wo es weh tut. Vermeintlich lahmes Methodenpraktikum (praktische Anwendung der Statistik) stellt sich als ein Cambrigde-gleicher Kurs mit einem Prof einem Postdoc und
lediglich Studis raus. Und as bereits im Bachelor. Alle diese 7 haben easy promoviert bzw. Jobs mit Statistikbezug bekommen.

Also -> Uni suchen wo du dich safe fühlst und vor allem die du dir leisten kannst. Besser 7 Semester an der FU Berlin konzentriert und happy als in NL 6 Semester voll hustlen und einen Berg Schulden wg. Gebühren für ausländische Studierende. Im Master würde ich sowas wie die UNC in Chapel Hill als Auslandsjahr empfehlen, alles Statistiker in dem Bums, geile Forschungsprojekte querbeet und mit der Duke Uni im Nachbarort direkt fetteste Möglichkeiten.

Sowas gibt es etliche Male in der Welt. Recherche, fragen und nicht aufgeben. Wenn man engagiert ist passieren auch mal so Sachen wie eine Summer School an einer Ivy League Uni. Einfach nur weil ein Prof. mit einem ein schöneres Leben hat. Nullchecker gibt es genügend.

Stimme da zu. So viele Statistik Master (Statistik, kein Data Science) gibts in Deutschland nicht. Die sind allesamt nicht schlecht und um ein Vielfaches besser als manch andere überlaufene Studiengänge.

antworten
WiWi Gast

Data Scientist

In Bamberg und Trier waren es auch nicht viel mehr. Einen guten Job hat danach jeder bekommen, meines Wissens nach

In meinem Statistik Master in Schweden waren wir zwischen 5-15 Leuten in den Modulen. In einigen Bachelor Wahlfächern war ich sogar der einzige Student. Und kostenlos war es auch.

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 02.11.2023:

In Bamberg und Trier waren es auch nicht viel mehr. Einen guten Job hat danach jeder bekommen, meines Wissens nach

In meinem Statistik Master in Schweden waren wir zwischen 5-15 Leuten in den Modulen. In einigen Bachelor Wahlfächern war ich sogar der einzige Student. Und kostenlos war es auch.

Same in Berlin. Hatten oft gemeinsame E-Seminare und -vorlesungen mit Bamberg und Trier

antworten
WiWi Gast

Data Scientist

Persönlich hätte ich keinen Bock auf Survey Statistik gehabt. Mein Studiengang hatte Schwerpunkte auf Hochdimensionale Datenanalyse, Bayesian und auf Kausale Inferenz.

antworten
WiWi Gast

Data Scientist

Kann jedem hier ETH Zürich empfehlen. Die Forschungsgruppen dort kooperieren mit den "großen" intel, nvidia, meta, google etc. Sehr stark was Machine Learning angeht.

antworten
WiWi Gast

Data Scientist

WiWi Gast schrieb am 02.11.2023:

Persönlich hätte ich keinen Bock auf Survey Statistik gehabt. Mein Studiengang hatte Schwerpunkte auf Hochdimensionale Datenanalyse, Bayesian und auf Kausale Inferenz.

Hatte ich auch nicht. Konnte zum Glück den Survey Part weitesgehend umgehen (außer Stichprobentheorie). Ansonsten gleiche Module wie du.

antworten

Artikel zu Data Scientist

Weiterbildung zum Data Scientist: International Program in Survey and Data Science

Grafik mit Binärcode und typografischen Elementen "International Program Survey and Data Science!

Die Universität Mannheim bildet mit dem „International Program in Survey and Data Science“ Daten-Expertinnen und Datenexperten für den internationalen Arbeitsmarkt aus. Die Weiterbildung wurde in Zusammenarbeit mit der University of Maryland in den USA entwickelt und startet bereits in der zweiten Runde. Voraussetzungen für die Zulassung sind unter anderem ein erster Bachelorabschluss und Berufserfahrung in den Bereichen Datenerhebung oder Datenanalyse.

Absolventen-Gehaltsreport 2018/19: Höhere Einstiegsgehälter bei WiWis

Absolventen-Gehaltsreport-2018: Absolventenhut und fliegende Geldmünzen

Wie im Vorjahr verdienen die Wirtschaftsingenieure bei den Absolventen der Wirtschaftswissenschaften mit 48.696 Euro im Schnitt am meisten. Sie legten im StepStone Gehaltsreport für Absolventen 2018/2019 damit um 458 Euro zu. Wirtschaftsinformatiker erhalten mit 45.566 Euro (2017: 45.449 Euro) und Absolventen der Wirtschaftswissenschaften, VWL und BWL und mit 43.033 Euro (2017: 42.265 Euro) ebenfalls etwas höhere Einstiegsgehälter.

IG Metall Gehaltsstudie 2016/2017 - Einstiegsgehälter Wirtschaftswissenschaftler

Einstiegsgehalt Wirtschaftswissenschaftler

Was verdienen Wirtschaftswissenschaftler beim Berufseinstieg? In Unternehmen mit einem Tarifvertrag verdienten junge Wirtschaftswissenschaftler mit bis zu drei Jahren Berufserfahrung in 2016 durchschnittlich 49.938 Euro im Jahr. In nicht tarifgebundenen Betrieben lagen die Einstiegsgehälter von Wirtschaftswissenschaftlern mit 42.445 Euro etwa 17,7 Prozent darunter. Im Vorjahr hatte dieser Gehaltsvorteil bei den Wirtschaftswissenschaftlern noch 33 Prozent betragen.

Absolventen-Gehaltsreport: Wirtschaftsingenieure mit 48.200 Euro die Spitzenverdiener

Titelblatt StepStone Gehaltsreport 2017

Die Wirtschaftsingenieure verdienen unter den Absolventen der Wirtschaftswissenschaften mit durchschnittlich 48.238 Euro am meisten. Auch bei den Einstiegsgehältern aller Studiengänge liegen die Wirtschaftsingenieure hinter den Medizinern auf Rang zwei im StepStone Gehaltsreport für Absolventen 2017. Wirtschaftsinformatiker erhalten 45.449 Euro, Absolventen der BWL, VWL und Wirtschaftswissenschaften steigen mit 42.265 Euro ein.

Gehälter von Führungskräften in Pharma- und Chemiebranche 2019 gestiegen

Gehaltsstudie: Chemiebranche Pharmabranche 2019-2021

Die Gehälter von Führungskräften in der chemisch-pharmazeutischen Industrie nahmen 2019 um 3,5 Prozent zu. Die tariflichen Mindestjahresbezüge für Akademiker wurden zuletzt im Dezember 2019 erhöht. Das Tarifgehalt für Angestellte mit einem Diplom oder Masterabschluss im zweiten Beschäftigungsjahr beträgt im Jahr 2020 67.600 Euro und mit einer Promotion 78.750 Euro. Für das erste Jahr der Beschäftigung können die Bezüge weiterhin frei vereinbart werden.

Toptalente: Studentinnen fordern weniger Gehalt

Gehälter: Der Blick einer Frau in die Ferne symbolisiert die Gehaltsaussichten

Studie: Top-Studentinnen fordern weniger Gehalt als männliche Toptalente - Männer erwarten schon zum Start 12.000 Euro mehr Jahresgehalt als Frauen. Allen Studierenden ist der gute Ruf des Unternehmens besonders wichtig bei der Arbeitgeberwahl. Work-Life-Balance und flexibles Arbeiten sind weniger wichtig.

War for Talents bei Wirtschaftskanzleien mit hohen Einstiegsgehältern

Wolkenkratzer einer Wirtschaftskanzlei

Hohe Einstiegsgehälter bereiten den Wirtschaftskanzleien zunehmend Sorgen. Neben der Digitalisierung ist auch das Thema Personal für deutsche Wirtschaftskanzleien von strategischer Bedeutung. Erste Wirtschaftskanzleien bieten Mitarbeitern bereits weitere Benefits über das Gehalt hinaus an. Legal-Tech-Mitarbeiter kommen weiterhin vor allem aus den klassischen Ausbildungsgebieten, so lauten die Ergebnisse der neuen Lünendonk-Studie 2018 über Wirtschaftskanzleien in Deutschland.

Gehaltsatlas 2016: Berufseinsteiger mit BWL-Abschluss verdienen durchschnittlich 43.788 Euro

Ein aufgeschlagener Atlas, alte Bücher und eine Tasse.

Akademische Berufseinsteiger mit einem Abschluss in Betriebswirtschaftslehre verdienen aktuell rund 43.800 Euro im Jahr. Das ist knapp unter dem deutschen Durchschnittsgehalt junger Akademiker mit 45.397 Euro im Jahr. Am besten verdienen BWL-Absolventen in Bayern, Baden-Württemberg, Hessen und Nordrhein-Westfalen. In welchen Städten akademischen Berufseinsteigern am meisten gezahlt wird, zeigt der diesjährige Gehaltsatlas 2016 von der Frankfurter Allgemeinen Zeitung (F.A.Z.) und Gehalt.de.

frauenlohnspiegel.de - Info-Portal zu Gehaltsunterschieden

frauenlohnspiegel: Eine Geschäftsfrau telefoniert und lacht dabei.

Welche Unterschiede gibt es zwischen Frauen und Männern im Arbeitsleben, etwa beim monatlichen Gehalt in den einzelnen Berufen oder bei den Extras wie z. B. Sonderzahlungen? Mit dem Internetportal www.frauenlohnspiegel.de unternimmt das WSI-Tarifarchiv seit einigen Jahren den Versuch, mehr Transparenz in die Einkommens- und Arbeitsbedingungen von Frauen (und Männern) zu bringen.

Gehaltsvorstellung: Wunschgehälter von Wirtschaftswissenschaftlern sinken

Studie Cover Berufsstart Gehalt + Bewerbung

Die Zeiten ändern sich: Absolventen der Wirtschaftswissenschaften und Ingenieurwissenschaften haben ihre Erwartungen beim Einstiegsgehalt gesenkt. Das hat die Studie "Attraktive Arbeitgeber" der Jobbörse Berufsstart.de ergeben. Demnach wollen Wirtschaftswissenschaftler zwischen 35.000 und 40.000 Euro Jahresgehalt, Ingenieure wünschen sich zwischen 45.000 und 50.000 Euro Einstiegsgehalt.

Crowdworking-Gehälter: Crowdworker verdienen trotz Studium oft nur 1.500 Euro

Das Netz eines Spielplatzklettergerüstes vor blauem Himmel.

Gut ausgebildete Crowd-Worker erhalten trotz Hochschulabschluss nur ein monatliches Gehalt von 1.500 Euro. Viele der Crowd-Worker arbeiten nebenberuflich, sind ledig und jung. Knapp die Hälfte hat studiert. Zu diesen Ergebnissen kommen eine Studie der Hans-Böckler-Stiftung und eine Studie des Zentrums für Europäische Wirtschaftsforschung (ZEW).

Consultants sind die Top-Verdiener unter den Absolventen

Rückenbild von einem Mann mit weiß-kariertem Hemd und Hosenträgern.

Beim Berufseinstieg in der Unternehmensberatung verdienen Hochschulabsolventen aktuell am meisten. Im Consulting liegen die Einstiegsgehälter bei durchschnittlich 51.400 Euro im Jahr. Je höher der akademische Abschluss ist, desto höher fällt laut einer aktuellen Gehaltsstudie der Kienbaum Unternehmensberatung auch das Einstiegsgehalt aus.

IG Metall Gehaltsstudie 2015 - Einstiegsgehälter Wirtschaftswissenschaftler

Absolventenhut und fliegende Geldmünzen

Was können Wirtschaftswissenschaftler beim Berufseinstieg verdienen? In Unternehmen mit einem Tarifvertrag verdienten junge Wirtschaftswissenschaftlerinnen und Wirtschaftswissenschaftler mit bis zu drei Jahren Berufserfahrung in 2015 durchschnittlich 48.850 Euro im Jahr. In nicht tarifgebundenen Betrieben lagen die Einstiegsgehälter von Wirtschaftswissenschaftler etwa 33 Prozent darunter.

Studie: Einstiegsgehälter im Consulting steigen stärker als auf den höheren Hierarchieebenen

BDU-Studie „Vergütung in der Unternehmensberatung 2014/2015“:  Ein Legomännchen im Anzug mit Geldscheinen symbolisiert das Thema Consulting-Gehälter.

Berufseinsteiger in der Consultingbranche können zurzeit mit einer stärkeren Anhebung ihrer Gehälter rechnen als Mitarbeiter der höheren Hierarchieebenen. Diese aktuellen Ergebnisse seiner Studie „Vergütung in der Unternehmensberatung 2014/2015“ hat der Bundesverband Deutscher Unternehmensberater (BDU) vorgestellt.

IG Metall Gehaltsstudie 2014 - Einstiegsgehälter Wirtschaftswissenschaften

Vier Männchen aus weißen Büroklammern und den weißen Buchstaben W, I, W und I turnen auf Münzentürmen.

Was können Berufsanfänger verdienen? Jährlich analysiert die IG Metall die Einstiegsgehälter von Absolventen in der Metall- und Elektroindustrie. In Unternehmen mit einem Tarifvertrag verdienten junge Wirtschaftswissenschaftlerinnen und Wirtschaftswissenschaftler mit 47952 Euro Jahresentgelt in 2014 bis zu 35 Prozent mehr.

Antworten auf Data Scientist

Als WiWi Gast oder Login

Forenfunktionen

Kommentare 85 Beiträge

Diskussionen zu Data Scientist

Weitere Themen aus Einstiegsgehälter