Practical Text Mining with Perl

Author: Roger Bilisoly

Publisher: John Wiley & Sons

ISBN: 1118210506

Category: Computers

Page: 296

View: 7049

Provides readers with the methods, algorithms, and means toperform text mining tasks This book is devoted to the fundamentals of text mining usingPerl, an open-source programming tool that is freely available viathe Internet (www.perl.org). It covers mining ideas from severalperspectives--statistics, data mining, linguistics, and informationretrieval--and provides readers with the means to successfullycomplete text mining tasks on their own. The book begins with an introduction to regular expressions, atext pattern methodology, and quantitative text summaries, all ofwhich are fundamental tools of analyzing text. Then, it builds uponthis foundation to explore: Probability and texts, including the bag-of-words model Information retrieval techniques such as the TF-IDF similaritymeasure Concordance lines and corpus linguistics Multivariate techniques such as correlation, principalcomponents analysis, and clustering Perl modules, German, and permutation tests Each chapter is devoted to a single key topic, and the authorcarefully and thoughtfully introduces mathematical concepts as theyarise, allowing readers to learn as they go without having to referto additional books. The inclusion of numerous exercises andworked-out examples further complements the book's student-friendlyformat. Practical Text Mining with Perl is ideal as a textbookfor undergraduate and graduate courses in text mining and as areference for a variety of professionals who are interested inextracting information from text documents.

Data Mining and Learning Analytics

Applications in Educational Research

Author: Samira ElAtia,Donald Ipperciel,Osmar R. Zaïane

Publisher: John Wiley & Sons

ISBN: 1118998219

Category: Computers

Page: 320

View: 5319

Addresses the impacts of data mining on education and reviews applications in educational research teaching, and learning This book discusses the insights, challenges, issues, expectations, and practical implementation of data mining (DM) within educational mandates. Initial series of chapters offer a general overview of DM, Learning Analytics (LA), and data collection models in the context of educational research, while also defining and discussing data mining’s four guiding principles— prediction, clustering, rule association, and outlier detection. The next series of chapters showcase the pedagogical applications of Educational Data Mining (EDM) and feature case studies drawn from Business, Humanities, Health Sciences, Linguistics, and Physical Sciences education that serve to highlight the successes and some of the limitations of data mining research applications in educational settings. The remaining chapters focus exclusively on EDM’s emerging role in helping to advance educational research—from identifying at-risk students and closing socioeconomic gaps in achievement to aiding in teacher evaluation and facilitating peer conferencing. This book features contributions from international experts in a variety of fields. Includes case studies where data mining techniques have been effectively applied to advance teaching and learning Addresses applications of data mining in educational research, including: social networking and education; policy and legislation in the classroom; and identification of at-risk students Explores Massive Open Online Courses (MOOCs) to study the effectiveness of online networks in promoting learning and understanding the communication patterns among users and students Features supplementary resources including a primer on foundational aspects of educational mining and learning analytics Data Mining and Learning Analytics: Applications in Educational Research is written for both scientists in EDM and educators interested in using and integrating DM and LA to improve education and advance educational research.

Data Mining and Predictive Analytics

Author: Daniel T. Larose

Publisher: John Wiley & Sons

ISBN: 1118868706

Category: Computers

Page: 824

View: 2424

Learn methods of data analysis and their application to real-world data sets This updated second edition serves as an introduction to data mining methods and models, including association rules, clustering, neural networks, logistic regression, and multivariate analysis. The authors apply a unified “white box” approach to data mining methods and models. This approach is designed to walk readers through the operations and nuances of the various methods, using small data sets, so readers can gain an insight into the inner workings of the method under review. Chapters provide readers with hands-on analysis problems, representing an opportunity for readers to apply their newly-acquired data mining expertise to solving real problems using large, real-world data sets. Data Mining and Predictive Analytics: Offers comprehensive coverage of association rules, clustering, neural networks, logistic regression, multivariate analysis, and R statistical programming language Features over 750 chapter exercises, allowing readers to assess their understanding of the new material Provides a detailed case study that brings together the lessons learned in the book Includes access to the companion website, www.dataminingconsultant, with exclusive password-protected instructor content Data Mining and Predictive Analytics will appeal to computer science and statistic students, as well as students in MBA programs, and chief executives.

R in a Nutshell

Author: Joseph Adler

Publisher: O'Reilly Germany

ISBN: 3897216507

Category: Computers

Page: 768

View: 4862

Wozu sollte man R lernen? Da gibt es viele Gründe: Weil man damit natürlich ganz andere Möglichkeiten hat als mit einer Tabellenkalkulation wie Excel, aber auch mehr Spielraum als mit gängiger Statistiksoftware wie SPSS und SAS. Anders als bei diesen Programmen hat man nämlich direkten Zugriff auf dieselbe, vollwertige Programmiersprache, mit der die fertigen Analyse- und Visualisierungsmethoden realisiert sind – so lassen sich nahtlos eigene Algorithmen integrieren und komplexe Arbeitsabläufe realisieren. Und nicht zuletzt, weil R offen gegenüber beliebigen Datenquellen ist, von der einfachen Textdatei über binäre Fremdformate bis hin zu den ganz großen relationalen Datenbanken. Zudem ist R Open Source und erobert momentan von der universitären Welt aus die professionelle Statistik. R kann viel. Und Sie können viel mit R machen – wenn Sie wissen, wie es geht. Willkommen in der R-Welt: Installieren Sie R und stöbern Sie in Ihrem gut bestückten Werkzeugkasten: Sie haben eine Konsole und eine grafische Benutzeroberfläche, unzählige vordefinierte Analyse- und Visualisierungsoperationen – und Pakete, Pakete, Pakete. Für quasi jeden statistischen Anwendungsbereich können Sie sich aus dem reichen Schatz der R-Community bedienen. Sprechen Sie R! Sie müssen Syntax und Grammatik von R nicht lernen – wie im Auslandsurlaub kommen Sie auch hier gut mit ein paar aufgeschnappten Brocken aus. Aber es lohnt sich: Wenn Sie wissen, was es mit R-Objekten auf sich hat, wie Sie eigene Funktionen schreiben und Ihre eigenen Pakete schnüren, sind Sie bei der Analyse Ihrer Daten noch flexibler und effektiver. Datenanalyse und Statistik in der Praxis: Anhand unzähliger Beispiele aus Medizin, Wirtschaft, Sport und Bioinformatik lernen Sie, wie Sie Daten aufbereiten, mithilfe der Grafikfunktionen des lattice-Pakets darstellen, statistische Tests durchführen und Modelle anpassen. Danach werden Ihnen Ihre Daten nichts mehr verheimlichen.

Risiko

Wie man die richtigen Entscheidungen trifft

Author: Gerd Gigerenzer

Publisher: C. Bertelsmann Verlag

ISBN: 3641119901

Category: Psychology

Page: 400

View: 4640

Der neue Bestseller von Gerd Gigerenzer Erinnern wir uns an die weltweite Angst vor der Schweinegrippe, als Experten eine nie dagewesene Pandemie prognostizierten und Impfstoff für Millionen produziert wurde, der später still und heimlich entsorgt werden musste. Für Gerd Gigerenzer ist dies nur ein Beleg unseres irrationalen Umgangs mit Risiken. Und das gilt für Experten ebenso wie für Laien. An Beispielen aus Medizin, Rechtswesen und Finanzwelt erläutert er, wie die Psychologie des Risikos funktioniert, was sie mit unseren entwicklungsgeschichtlich alten Hirnstrukturen zu tun hat und welche Gefahren damit einhergehen. Dabei analysiert er die ungute Rolle von irreführenden Informationen, die von Medien und Fachleuten verbreitet werden. Doch Risiken und Ungewissheiten richtig einzuschätzen kann und sollte jeder lernen. Diese Risikoschulung erprobt Gigerenzer seit vielen Jahren mit verblüffenden Ergebnissen. Sein Fazit: Schon Kinder können lernen, mit Risiken realistisch umzugehen und sich gegen Panikmache wie Verharmlosung zu immunisieren.

Data Warehouse & Data Mining

Author: Roland Gabriel,Peter Gluchowski,Alexander Pastwa

Publisher: W3l GmbH

ISBN: 3937137661

Category:

Page: 234

View: 3008

Data mining

praktische Werkzeuge und Techniken für das maschinelle Lernen

Author: Ian H. Witten,Eibe Frank

Publisher: N.A

ISBN: 9783446215337

Category:

Page: 386

View: 4144

Big Data in der Praxis

Beispiellösungen mit Hadoop und NoSQL. Daten speichern, aufbereiten, visualisieren

Author: Jonas Freiknecht

Publisher: Carl Hanser Verlag GmbH Co KG

ISBN: 3446441778

Category: Computers

Page: 448

View: 9630

BIG DATA IN DER PRAXIS // - Für Analysten, BI-Verantwortliche, Data-Scientists, Consultants - Auf der DVD finden Sie: 18 fertige Projekte, die im Buch Schritt für Schritt entwickelt werden; Videotutorials u.a. zur Installation von Hadoop, Hive, HBase (Gesamtdauer: 80 Min.); Testdatensätze für die Wissensdatenbank Dieses Buch bringt Ihnen das Thema Big Data auf sehr praktische Art und Weise nahe. Sie lernen Technologien, Tools und Methoden kennen, entwickeln Beispiel-Lösungen und bekommen aufgezeigt, wie Sie bestehende Systeme vorausschauend auf die mit dem Big Data-Trend einhergehenden Herausforderungen vorbereiten. Dazu werden Sie neben den bekannten Apache-Projekten wie Hadoop, Hive und HBase auch einige weniger bekannte Frameworks wie Apache UIMA oder Apache OpenNLP kennenlernen, um gezielt die Verarbeitung unstrukturierter Daten zu behandeln. Alle hier verwendeten Software-Komponenten stehen im vollen Umfang kostenlos im Internet zur Verfügung. Gemeinsam mit dem Autor werden Sie ganz konkret Schritt für Schritt viele kleinere Projekte aufbauen bis hin zu einer fertigen und funktionstüchtigen Implementierung. Ziel des Buches ist es, Sie auf den Effekt und den Mehrwert der neuen Möglichkeiten aufmerksam zu machen, sodass Sie diese konstruktiv in Ihr Unternehmen tragen können und für sich und Ihre Kollegen somit ein Bewusstsein für den Wert Ihrer Daten schaffen. AUS DEM INHALT // Einführung rund um Big Data // Hadoop installieren, konfigurieren & bedienen // HDFS, Map-Reduce & YARN: Daten speichern und verarbeiten // Hadoop-Ecosystem: Überblick über dessen Komponenten // Einführung in NoSQL // HBase installieren, einrichten & auf Daten zugreifen // Data-Warehousing mit Apache Hive // HiveQL als Abfragesprache, Hive Security, Hive & JDBC // Datenimport aus relationalen Datenbanken mit Sqoop // Big Data-Visualisierung: Diagrammarten, Tipps & Trends // Visualisierungs-Frameworks im Vergleich // D3.js: Entwicklung einiger Beispieldiagramme // Entwicklung einer abschließenden Big Data-Analyse-Lösung // Troubleshooting für die Arbeit mit Hadoop, Hive & HBase

Algorithmen und Datenstrukturen im VLSI-Design

OBDD — Grundlagen und Anwendungen

Author: Christoph Meinel,Thorsten Theobald

Publisher: Springer-Verlag

ISBN: 3642587739

Category: Computers

Page: 286

View: 5128

Eines der Hauptprobleme beim Chipentwurf besteht darin, daß die Anzahl der zu bewältigenden Kombinationen der einzelnen Chipbausteine ins Unermeßliche steigt. Hier hat sich eine sehr fruchtbare Verbindung zu einem Kerngebiet der Theoretischen Informatik, dem Gebiet des Entwurfs von Datenstrukturen und effizienten Algorithmen, herstellen lassen: das Konzept der geordneten binären Entscheidungsgraphen, das in zahlreichen CAD-Projekten zu einer beträchtlichen Leistungssteigerung geführt hat. Die Autoren stellen die Grundlagen dieses interdisziplinären Forschungsgebiets dar und behandeln wichtige Anwendungen aus dem rechnergestützten Schaltkreisentwurf.

Machine Learning mit Python

Das Praxis-Handbuch für Data Science, Predictive Analytics und Deep Learning

Author: Sebastian Raschka

Publisher: MITP-Verlags GmbH & Co. KG

ISBN: 3958454240

Category: Computers

Page: 424

View: 6857

Erweiterte Datenanalyse mit SPSS

Statistik und Data Mining

Author: Achim Bühl,Peter Zöfel

Publisher: Springer-Verlag

ISBN: 332289603X

Category: Computers

Page: 396

View: 8941

Das Buch beschreibt Methoden der Statistik und des Data Mining, die zu SPSS, der weltweit verbreitetsten Software zur statistischen Datenanalyse, in Form weiterer Module und Programme angeboten werden: Entscheidungsbaumanalyse (das Programm Answer Tree), mehrere Varianten der Korrespondenzanalyse, kategoriale Regression und multidimensionale Skalierung (Categories), Conjoint-Analyse (Conjoint), Pfadanalyse (Amos), Zeitreihenanalysen (Trends) sowie exakte Varianten für nichtparametrische Tests und Kreuztabellenstatistiken bei kleinen Fallzahlen (Exact Tests). Die Erstellung präsentationsreifer Tabellen (Tables) und weiterer Reportmöglichkeiten runden das Buch ab. Die Einführung in die Verfahren erfolgt anhand passender Beispiele, wobei auf komplizierte mathematische Herleitungen verzichtet wird. Alle Datenbeispiele sind auf einer CD beigegeben, so dass sie selbst nachvollzogen bzw. modifiziert werden können.

Data Science für Dummies

Author: Lillian Pierson

Publisher: John Wiley & Sons

ISBN: 352780675X

Category: Mathematics

Page: 382

View: 2948

Daten, Daten, Daten? Sie haben schon Kenntnisse in Excel und Statistik, wissen aber noch nicht, wie all die Datensätze helfen sollen, bessere Entscheidungen zu treffen? Von Lillian Pierson bekommen Sie das dafür notwendige Handwerkszeug: Bauen Sie Ihre Kenntnisse in Statistik, Programmierung und Visualisierung aus. Nutzen Sie Python, R, SQL, Excel und KNIME. Zahlreiche Beispiele veranschaulichen die vorgestellten Methoden und Techniken. So können Sie die Erkenntnisse dieses Buches auf Ihre Daten übertragen und aus deren Analyse unmittelbare Schlüsse und Konsequenzen ziehen.

Data mining, data warehousing

datenschutzrechtliche Orientierungshilfen für Privatunternehmen

Author: Alex Schweizer

Publisher: N.A

ISBN: 9783280025406

Category: Data mining

Page: 416

View: 2001

Private Unternehmung.

Theorie der neuronalen Netze

Eine systematische Einführung

Author: Raul Rojas

Publisher: Springer-Verlag

ISBN: 3642612318

Category: Computers

Page: 446

View: 6241

Neuronale Netze sind ein Berechenbarkeitsparadigma, das in der Informatik zunehmende Beachtung findet. In diesem Buch werden theoretische Ansätze und Modelle, die in der Literatur verstreut sind, zu einer modellübergreifenden Theorie der künstlichen neuronalen Netze zusammengefügt. Mit ständigem Blick auf die Biologie wird - ausgehend von einfachsten Netzen - gezeigt, wie sich die Eigenschaften der Modelle verändern, wenn allgemeinere Berechnungselemente und Netztopologien eingeführt werden. Jedes Kapitel enthält Beispiele und ist ausführlich illustriert und durch bibliographische Anmerkungen abgerundet. Das Buch richtet sich an Leser, die sich einen Überblick verschaffen oder vorhandene Kenntnisse vertiefen wollen. Es ist als Grundlage für Neuroinformatikvorlesungen an deutschsprachigen Universitäten geeignet.

Angewandte Bioinformatik

Eine Einführung

Author: Paul M. Selzer,Richard J. Marhöfer,Oliver Koch

Publisher: Springer-Verlag

ISBN: 3662541351

Category: Science

Page: 184

View: 7335

Für Studierende und Wissenschaftler der Lebenswissenschaften schafft dieses Buch einen schnellen, strukturierten Zugang zur Angewandten Bioinformatik ohne Programmierkenntnisse oder tiefgehende Informatikkenntnisse vorauszusetzen. Es bietet eine Einführung in die tägliche Anwendung der vielfältigen bioinformatischen Werkzeuge und gibt einen ersten Überblick über das sehr komplexe Fachgebiet. Die Kontrolle des vermittelten Stoffs wird durch Übungsbeispiele mit Lösungen gewährleistet. Ein Glossar der zugrundeliegenden Fachtermini sowie ein ausführliches Sachverzeichnis runden das Buch ab. Für die 2. Auflage wurde das Werk umfassend aktualisiert.

Über Wachstum und Form

Author: D'Arcy Wentworth Thompson,Anita Albus

Publisher: N.A

ISBN: 9783821845685

Category:

Page: 477

View: 7323

Bacteriological Techniques

Author: Karl Wittich,John W. H. Eyre

Publisher: BoD – Books on Demand

ISBN: 3955070212

Category:

Page: 280

View: 4362

Handbook for the study of bacteria, including detailed manuals about methods of sterilisation, the use and function of microscopes, staining methods, about how to cultivate, isolate and identify bacteria, etc. etc. Originally published in 1913.