SAP Datasphere bo olajšal podatkovno analitiko
Podjetje SAP je predstavil novo generacijo rešitev za podatkovno analitiko SAP Datasphere, s katerimi naj bi podjetjem omogočali celovite en enoten pogled na poslovne podatke, ne glede na to, ali se ti nahajajo v aplikacijah družbe SAP, podatkovnih skladiščih SAP ali pa v podatkovnih skladiščih drugih proizvajalcev.
SAP Datasphere je nadgradnja dosedanje storitve v oblaku SAP Sata Warehouse Cloud. Ponuja celovito upravljanje s podatki in podatkovnimi viri, kam sodijo integracija podatkov, katalogiziranje podatkov, semantično modeliranje, podatkovno skladiščenje ter federacija in virtualizacija podatkov.
Pomemben del nove rešitve in strategije je povezava družbe SAP z drugimi proizvajalci, s čimer bodo bolj učinkovito lahko v z orodjem Datasphere upravljali tudi podatke v drugih podatkovnih skladičih in jezerih. Sem sodijo družbe Collibra (podatkovno upravljanje), Confluent (rešitve za pretočni prenos podatkov), DataBot (strojno učenje) ter priznana družba Databricks, znana po začetkih na platformi Apache Spark.
Ideja, ki stoji za novo rešitvijo, in temelji na platformah SAP Business Technology Platform in SAP HANA Cloud, je v tem, da bi analitikom in svetovalcem v okolju SAP omogočala preprost način upravljanja s podatki v porazdeljenih podatkovnih sistemih, brez potrebe, da bi se ti podatki predhodno normalizirali in pretvarjali v enotno podatkovno skladišče, kot je bila v praksi doslej.
Namesto tega bo Datasphere omogočal dostop do podatkov po potrebi, kar zmanjšuje kompleksnost in pohitri povezovanja z novimi podatkovnimi viri. V preteklosti so tovrstne integracije zahtevale skrbno načrtovan prehod, kar je zamudno in drago.
Poteza družbe SAP je bila nekako pričakovana, saj so se konkurenti s svojimi izdelki že začeli povezovati na podrobne način s tujimi viri podatkov. Snowflake, Google Data Cloud in Claudera so v zadnjem času vsi najavili podporo za platformo Apache Iceberg, ki omogoča podoben koncept delovanja. Ta sloni na zapisu odprtih tabel (open table format), ki se vse bolj uveljavlja pri dostopu do podatkov v različnih skladiščih, podatkovnih jezerih in celo različnih oblakih.