Què és el Business Intelligence? - per a no informàtics
12 Octubre 07
Si ets informàtic, millor consulta aquest altre document.
Hi ha molts llocs on s’ explica que és el business intelligence i no seré jo ara qui inventi una nova manera de definir-ho. Però fa uns dies, explicant aquest concepte en un seminari per usuaris, se’ m va acudir de sobte una manera d’ explicar-ho que em va semblar que s’ entenia prou bé.
Imagineu que esteu al Far West. Ara també imagineu que travesseu un carrer ple de pols, mireu que no us atropelli un carruatge, i entreu en un edifici que posa BANK. Obriu la porta, i com resulta que és una ciutat important, el banc te 8 guixetes, i al darrera de cadascuna hi ha un home amb una gorra comptant diners.

Miraculosament, hi ha una guixeta lliure. Aneu cap allà, i li dieu a l’ home de la gorra que voleu fer un ingrés. Aquest home es dirigeix cap a una filera enorme d’ arxivador, amb carpetes ordenades per DNI (vaaale, es que és un far west modern). Aquest home agafa la vostra carpeta. A dins d’ aquesta carpeta hi troba 3 separadors, el primer amb una fulla amb les vostres dades, el segon amb una fulla que representa el vostre compte corrent, i el tercer separador amb el contracte del crèdit per pagar el vostre cavall. Agafarà el segon separador i apunta el vostre ingrés.

Fixeu-vos: el bank té a varis homes amb gorra que fan coses a la vegada per clients diferents, i el que fan és ràpid i senzill (buscar la carpeta / separador corresponent i apuntar): això en informàtica és un entorn transaccional.
És a dir, quan feu una operació bancària (en un caixer, a la guixeta o per internet), o us feu una assegurança, o compreu una entrada per anar al cine, o aneu a l’ ajuntament a demanar el padró, ho esteu fent en un entorn transaccional.
La pregunta ara és: en aquest arxivador enorme que hi ha en el nostre bank del far-west hi ha moltes dades, però, hi ha informació analítica?
Imagineu que el director de la sucursal, vol fer una campanya per oferir crèdits per comprar carruatges. Per fer això vol saber el nivell mig d’ ingressos dels clients per districte, i els districtes que solen demanar més crèdits però que a la vegada tinguin menys índex de morositat.
Què passarà?
-
Un dels empleats haurà de recórrer totes les carpetes, en cada una mirar en els diferents separadors, anar a un altre arxivador a mirar els carrers i districtes i anar sumant.
-
L’ empleat molestarà i toparà amb la resta, ja que el passadís de l’ arxivador és estret.
-
No podrà atendre als clients de la seva guixeta.
-
El resultat tardarà un parell de setmanes, ja que té que anar fent molts viatges i anar calculant, i potser ja fa tard per a que el director pugui fer la campanya.

Però a més, hi ha dues coses més que també són molt importants:
-
El director, un cop veu i estudia el resultat, observa un comportament estrany en un dels districtes. L’ empleat tindrà que tornar a recórrer totes les carpetes, buscar quins clients són els del districte, i passar-li la relació al director. És bastant probable, que amb les noves dades, el director torni a necessitar informació addicional.
-
Un altre problema subtil, però molt important és el següent: com el director sap que costa aconseguir aquesta informació, pensa detingudament quina informació és la que necessita a fi d’ enfocar correctament la campanya. El problema és que com demana dades que ja són conegudes per ell, subconscientment ja sap més o menys el resultat. És a dir, prendrà una decisió en funció d’ uns paràmetres que a priori ja ha pensat.
Però, com pot saber que realment aquells paràmetres eren els millors a considerar? Qui diu que en lloc de per districtes, no era millor fer-ho per codi postal?
Com es poden resoldre tots aquests problemes?
Simplificant molt, explicaré dues idees:
A veure , hem vist que per atendre el dia a dia del banc (recordem, entorn transaccional), calen varis empleats fent a la vegada petites feines diferents entre si, i a més, d’ una manera continua (perquè contínuament entren clients).
En canvi, hem vist que la petició del director, és una de sola molt de tan en tan, però que porta molta feina. I a més, no li cal una informació rabiosament actualitzada.
Primera idea:
Com hem quedat que el passadís de l’ arxivador era estret....fem un arxivador nou per nosaltres!. Periòdicament fotocopiarem totes les carpetes i les durem a una altra habitació per a no molestar a ningú. També contractarem a més personal, amb a diferència que quan arribi un client de tant en tant (el director, el responsable econòmic-financer, el de marketing...) el nou personal es posarà tot junt a resoldre la mateixa consulta (en el cas anterior es podrien dividir l’ arxivador en vàries parts i cadascú fer un tros).
Informàticament, el “nou personal” representen servidors, processadors o nodes.
Segona idea:
Aquesta habitació només serveix per consultar. Això és molt important, ja que gràcies a això en el procés de fotocopiat podem fer el següent: recordeu la carpeta d’ aquell client que ha anat a fer l’ ingrés?. Tenia tres separadors, el primer amb una fulla amb les dades personals, el segon amb una fulla que representa el compte corrent, i el tercer amb el contracte del crèdit per pagar el cavall. Les dades personals només poden estar en un lloc, ja si les tingués també en el compte corrent i en el contracte de crèdit, el dia que volguéssim modificar el telèfon, mai estaríem segurs d’ haver-ho fet en tots els llocs. És a dir, en un entorn transaccional mai tenim dades duplicades, per garantir la integritat de les mateixes.
Però, qui m’ impedeix ara fotocopiar aquesta fulla i posar-la en tots els separadors? D’ aquesta manera, sempre que consulti només tindré que anar en un separador en lloc de dos.
A més, com aquests del far-west se les sabien totes, la mateixa fotocopiadora és capaç d’ anar sumant i fent càlculs diversos, resultats dels quals deixa en diferents arxivadors nous, que no hi són en “l’ habitació transaccional”, per si algun dia algú els necessita
És a dir, en el nou arxivador, dupliquem coses, desendrecem pre-calculem i tot plegat ho ordenem de manera que ens vagi millor per fer consultes massives de dades.
Doncs aquests tipus d’ habitacions tenen el nom de data warehouse.
Problemes de “l’ habitació data warehouse”
Com “no es oro todo lo que reluce”, ens podem trobar amb uns quants problemes a tenir en compte.
-
És obvi que tot aquest muntatge és caríssim, en hardware, en personal i en les llicències de software
-
En el procés de “fotocopiat” (que recordem que també fem càlculs i canviem d’ ordre les coses) podem tenir errors.
-
No sempre el que es posa en el data warehouse és el que acaba necessitant l’ usuari.
-
El procés de còpia i tranformació de dades pot resultar lent i complex
Consideracions addicionals
En el compte del far-west explicava que “l’ habitació data warehouse” només l’ utilitzava el personal de més rang del banc, els que tenen de prendre decisions. De fet això és el que passava fins fa pocs anys amb el business intelligence, però recentment estan passant dues coses que estan provocant la “democratització” en l’ ús del BI.
-
El creixement en volum dels transaccionals és tan immens, que cada cop són més intractables per fer-hi consultes no transaccionals.
-
Les eines de BI d’ usuari han millorat moltíssim en potència i facilitat d’ ús, cosa que les fan atractives per qualsevol tipus d’ usuari d’ una organització
Fins fa poc, el BI estava reservat a grans empreses. En gran part continua sent així, però s’ observa un important creixement en l’ administració pública i en les empreses mitjanes.