Bazodanowe problemy klasyfikacji danych to problem dotyczący niejednej firmy. Bardzo czasochłonnym byłoby zajęcie, zliczania każdej transakcji w dowolnym supermarkecie w celu wyliczenia średniej ceny sprzedaży. Jeżeli firma ma zamiar dostosować się do zmian, które zachodzą na rynku, to powinna jak najszybciej dobrać odpowiednie narzędzia do ich monitorowania.

Wyliczanie statystyk zawierających takie dane jak: średnia cena sprzedaży, mediana ceny, dominanta ceny oraz odchylenie standardowe wymaga odpowiedniego oprogramowania. Można oczywiście skorzystać z podstawowych, znanych każdemu użytkownikowi komputera programów biurowych. Natomiast do profesjonalnego i odpowiednio dobranego do charakteru działalności przedsiębiorstwa, oprogramowanie należy stworzyć od początku. Zazwyczaj zlecenia jakie spływają do firm typu Software house, opiewają w ogromne ilości rekordów danych. Są to pliki rzędu od 500 000 do 70mln rekordów.

Dane jakimi zajmuje się program zawierają najczęściej podstawowe, ale ważne dla przedsiębiorcy dane. Możemy wyróżnić: cenę sprzedaży, województwo, rok oraz miesiąc zawarcia transakcji(czyli szczegółową datę). Do bardziej precyzujących produkt to na przykład jego kod oraz grupę produktową do jakiej należy. Najchętniej takie ilości danych w dziecinnym wyobrażeniu włożylibyśmy do jakiejś maszyny i oczekiwali, że po chwili zwróci nam jak na tacy oczekiwane wyniki. Najlepiej takie, których potrzebujemy po dokonaniu analizy, aby przeprowadzić spotkanie z zarządem w oparci o nie. Takim urządzeniem właśnie jest komputer. Branża IT jest więc bardzo prężnie działającą branża w biznesie. Niejedna firma programistyczna ma za zadanie zajmować się bazami danych największych gigantów biznesu w kraju. Wracając do komputerów to, aby z nich skorzystać musimy się z nimi komunikować. Współczesne języki programowania umożliwiają nam to w najprostszy sposób z możliwych. Komputer jest maszyną na wzór bardzo zaawansowanego kalkulatora i jest w stanie przeprowadzić obliczenia na wielkiej ilości danych w mgnieniu oka.