Blog-Archive

Datengetriebene Vorhersage von Immobilienpreisen

Ziel dieses Projekts ist Vorhersage von Immobilienpreisen in Großbritannien, speziell in England und Wales. Da auf Basis des ursprünglichen Datensatzes keine gute Vorhersage der Immobilienpreise möglich ist, wurde dieser um sozioökonomische Daten ergänzt.

Hierzu zählen beispielsweise das BIP und Arbeitslosenquote … Weiterlesen >

Getagged mit: , , , , , , , , ,

Entscheidungsbäume vs. Random Forest vs. Boosting

Entscheidungsbäume sind eine einfache Möglichkeit, Klassifikations- oder Regressionsprobleme verständlich abzubilden. Der Nachteil ist die meist schlechtere Performance gegenüber moderneren Machine Learning Ansätzen.

Dieser Performancenachteil kann durch die Idee des Ensemblemodellierens und der darauf Basierenden Methode des Random Forest bzw. des … Weiterlesen >

Getagged mit: , , , , , , , , ,

Integration von XGBoost in SAP HANA Analysen mithilfe von R

Nachdem die technische Integration von R in http://blog.five1.de/installation-von-r-fur-die-verwendung-mit-sap-hana/ von Marcel Salein beschrieben wurde, möchte ich einen kleinen Überblick über die Möglichkeiten der Schnittstellen zeigen.

Vorbereitung

Installieren von R Paketen auf dem R-Server

Doch bevor es losgeht, müssen noch einige Packet … Weiterlesen >

Getagged mit: , , , , , , ,