Poglądy są jak pępki – każdy ma swój

Większość firm chce wiedzieć, co mówią o nich klienci, ale nikt nie ma czasu na przeczytanie 1000 odpowiedzi na ankietę lub tylu recenzji produktu. Zamiast tego oczekujemy krótkiego podsumowania. Najczęściej przy ocenie produktu widzimy ranking gwiazdek – im produkt lepszy, tym więcej ich otrzymuje. Ale gwiazdki nie powiedzą nam co w tym produkcie klienci cenią najbardziej, co najmniej.

Tradycyjne techniki Natural Language Processing polegają na zliczaniu wystąpień danych słów lub wyrażeń w tekście. Często tekst poddany zostaje analizie „machine learning” i „training” co jest niczym innym jak raczej prymitywną, siłową metoda klasyfikowania tekstu na podstawie wcześniej odpowiednio sklasyfikowanego materiału.

Więcej…

Jak pobrać dane z Web Service do Oracle

Czyli jak połączyć się z Web Serwisem, pobrać dane, sparsować je i załadować do bazy danych lub użyć w aplikacji. Oto czego będziesz potrzebować:

Uprawnienia w bazie danych do wykonywania połączeń HTTP
Wgrany certyfikat Web Serwisu z którym się łączysz - jeśli połączenie jest https (przeważnie jest)
Umiejętności parsowania JSON w Oracle. Zazwyczaj WS zwraca dane w formacie JSON
Umiejętności szyfrowania danych (np. sekretkey) - jeśli WS tego wymaga

Wszystko powyższe przećwiczymy w tym artykule. W pierwszej części informacja o niezbędnych komponentach. Być może niektóre z nich nie są Ci potrzebne, pomiń te sekcje, ale w realnym scenariuszu rzadko jest potrzeba wykonania tylko trywialnego polaczenia z prostyym serwisem i wykonanie GET. Najczęściej jest potrzeba kodowania danych, parsowania wyników. Dlatego ten przykład jest inny od wiekszości przykładów w Internecie. W drugiej części zbierzemy wszystko do kupy w działającą procedurę.

Więcej…

Integracja Pentaho Kettle z Elasticsearch

W tym artykule dowiesz się jak pobrać dane z Elasticsearch z poziomu Pentaho Kettle. Elasticsearch jest bazą typu noSQL która oferuje wysoką prędkość odczytu nieustrukturyzowanych danych. Dostęp do bazy Elasticsearch jest nieco inny niż do baz SQL. Jeśli zatem masz zbiory danych w tym formacie i chcesz się do nich podłączyć z poziomu Pentaho, zobacz jak możesz to uzyskać.

Więcej…

Pentaho Report Designer - automatyzowanie raportów

W tym artykule zajmiemy się automatycznym tworzeniem raportów w Pentaho Report Designer (PRD). PRD umożliwia jak wiele takich narzędzi tworzenie raportów które możesz eksportować do statycznych formatów jak PDF, HTML, CSV... Cała jednak moc tego narzędzia to przygotowywanie treści dynamicznie, w zależności od obecnego stanu danych.

Dzięki temu możliwe jest np. tworzenie:

Plików Excela zawierających podsumowania dla każdego z kontrahentów
Mailingu do klientów
Raportów z obrotem każdej dywizji sprzedażowej z podziałem na grupy handlowe uzupełniony wykresami
Wygenerowanie i wysyłka faktur do klientów

Więcej…

Strona 20 z 23