Till innehåll på sidan

KTH BigDataBase and Enabling Data Sharing

Design och utveckling av en big-data databas som samlar data från andra befintliga databaser – som i sin tur hanterar sensordata från olika verksamheter. Databasen ska även hantera sakernas internet och artificiell intelligens-tekniker som maskininlärning. Med databasen tillgängliggörs data som kan synliggöra innovation inom bygg- och fastighetssektorerna på nya sätt.

Bakgrund

Intresset att förlägga forskning och utveckling i faktiska miljöer är stort och det finns ett starkt behov från industrin och akademin att tillgängliggöra städer, byggnader och verksamheter för forskning, tester och utbildning. Ofta finns städer och byggnader med sensorer och uppkopplade enheter tillgängligt, men strukturer, rutiner och system för effektiv och säker hantering av data och information kopplat till data saknas. Företag och organisationer har ofta även stora datasets lagrade, men relevanta lagliga strukturer för hur data kan och bör användas saknas oftast. För att kunna nyttja data och förstå användningen av städer, byggnader och verksamheter bättre behövs en öppen och transparent datahantering: en öppen databas.

Med uppbyggandet av en öppen databas följer även frågor kring integritet och datasäkerhet. KTH Live-In Lab har redan genomfört ett projekt kring GDPR och Smarta Byggnader i samverkan med rättsinformatik på Stockholms Universitet (SU), och ett fortsättningsprojekt kring etikprövning och smarta byggnader pågår. Samtal pågår nu även med SU kring en nationell forskningsdatabas.

Många forskargrupper och lärare saknar i dagsläget data för att extrahera information vilket gör att forskning och utbildning ofta hänvisas till simuleringar baserade på fabricerade datasets för test och verifiering av modeller eller prototyper. KTH BigDataBase kommer tillhandahålla både databas och realtidsdata till forskargrupper vilka tidigare inte haft tillgång till detta. Inte nog med det, BigDataBase kommer även tillhandahålla sakkunskap om hur datan har genererats, vilket ökar validiteten för framtagna forskningsresultat.

Projektbeskrivning

Projektet syftar till att kravställa och implementera en databas som på ett skalbart sätt hanterar stora datamängder med initialt fokus på fastighets- och brukardata samt data från städer: Det handlar om att designa och utveckla en big-data databas som samlar data från andra befintliga databaser som, i sin tur, hanterar sensordata i olika verksamheter. Databasen ska även hantera IoT och Artificiell Intelligens-tekniker, såsom maskininlärning för att tillhandahålla data till olika intressentgrupper, forskare, studenter, men även SME-företag och fastighetsägare som att de kan möjliggöra innovationer och därmed stärka Sveriges konkurrenskraft.

Den underliggande hypotesen med databasen är att innovation i bygg- och fastighetssektorerna kan synliggöras på helt nya sätt och till nya grupper genom att visa användbarheten av fastighetsrelaterade data, t.ex. att öka förståelsen hos både förvaltare och boende för verklig drift av byggnader.

  • Projektet tar fram en design för databasen och förslag på strukturer för informationshantering, informationsspridning och samverkan.
  • Databasen skall kunna ta hand om data både från KTH Live-In Lab, men även andra byggnader som är tänkta att bli delar av KTH Live-In Lab:s infrastruktur.
  • Data skall på ett säkert och pålitligt sätt kunna göras tillgänglig till alla olika inblandade aktörer, från studenter och forskare till företag och myndigheter.
  • Problemställningar som datakvalité, skalbarhet och kommunikationshastighet tas i beaktning och undersökas noggrant.
  • Projektet ska förutom en databasprototyp även resultera i riktlinjer, kravspecifikationer, metoder och guider för hur olika aktörer som vill hantera stora mängder data och information kan arbeta med lagring, tillgängliggörande och informationsspridning.

Genomförande

Projektet utförs i tre delar:

  1. WP1: Kravställning och identifikation av usecases (Q3-4 2019)
  2. WP2: Uppbyggnad av prototyp (Q1-2 2020)
  3. WP3: GDPR och regelverk kring datalagring (Q1-4 2020)
  4. WP4: Test av prototyp (Q3-4 2020)

WP1

Vi har efter att ha gått igenom en del av de idag större och mer omfattande lösningarna som skulle kunna täcka

dels de behov LiL har, men också behoven för KTH i stort, och kommit fram till att en databaslösning baserad på den öppna plattformen Hadoop skulle vara lämplig att testköra för syftet.

Denna lösning används och utvecklas idag av flera stora aktörer, t.ex Google och British Royal Mail.

Då denna lösning, i stordata och mångsidighet, är av modell större i projektläggning och karaktär, så kommer en lösning att tas fram och utvärderas i etapper varpå vi efter hand och behov utökar dess funktionalitet i takt med att LiL projektet växer.

Use cases som vi utgått ifrån

  • ”As a student, I would like to analyse data* (or rather that something analyses the data for me!) in order to improve my studying condition.
    Detta kan vara data som kommer från olika källor och lever ostrukturerat i KTHBD”
  • ”Som forskare vill jag kunna få access till rådata (realtids och historisk) för att kunna utveckla nya tjänster.
    Detta kan vara data som kommer från olika källor och lever ostrukturerat i KTHBD”
  • ”Som drift/operatör vill jag kunna skapa enkla diagram, aggregering av datasets, avpersonifiera data för att delge data på hemsida.
    Detta kan vara data som kommer från olika källor och lever ostrukturerat i KTHBD”
  • ”Som lärare vill jag kunna hämta avpersonifierad data för att kunna skapa case studies/projekt kring byggnader och system.
    Detta kan vara data som kommer från olika källor och lever ostrukturerat i KTHBD”
  • ”Som forskare vill jag att LIL:s data ska tillgängliggöras så att jag kan analysera och utforska värdeskapande innovativa tjänster.”
  • ”Som forskare vill jag att LIL:s system och installationer i bostäderna ska tillgängliggöras så att jag kan involvera hyresgästerna att testa nya innovativa produkter och tjänster.”
  • ”Som finansiär vill jag att forskningsprojekt som bedrivs i LIL skall publiceras så att jag kan ta del av metod och resultat för att nå bättre insikt och kunskap”
  • ”Som finansiär vill jag kunna initiera forsknings-och utvecklingsprojekt i LIL så att jag kan agera som en involverad och drivande partner”
  • ”Som finansiär vill jag att forskningsprojekt som bedrivs i LIL skall generera värdeskapande kommersialiseringsbara lösningar så att jag kan agera som en affärspartner”
  • ”As a researcher, I would like to use personal information of the inhabitants (age, activity...) and information about the different sites (outside temperature, light condition...) in order to ponder my findings.”
  • “Som startup inom sensor-utveckling vill jag kunna verifiera rådata från egen-utvecklade sensorer mot befintlig kontrolldata från KTH LIL, samt kunna träna matematiska modeller för att extrapolera ny data.”
  • ”Som forskare vill jag kunna installera nya sensorer och system och få värden från dessa in till samma system som befintliga sensorer/system.”

Med ovanstående behov som utgångspunkt är vi övertygade att en BigData lösning (KTHBD) kommer täcka de behov som finns på KTH idag och framöver.

Syfte

Projektet syftar till att ta fram strukturer för informationshantering och spridning av data från främst verksamheter inom KTH. Dessa strukturer testas genom att bygga upp en fullskalig databas för KTH Live-In Lab och KTH-MIT Senseable Stockholm Lab. Strukturerna skall vara generiska och kunna användas för framtagande av databaser för andra sorters data. Data skall på ett säkert och pålitligt sätt kunna göras tillgänglig till olika aktörer. Problemställningar som datakvalité, skalbarhet och kommunikationshastighet tas i beaktning.

Mål

Målet med projektet är en skalbar och öppen databasprototyp som stödjer användarnas behov och samlar och tillhandahåller data och information. Ett långsiktigt mål är att genom metoder som maskininlärning kunna modellera och predikterera skeenden och därmed automatisera processer inom nya områden genom sammanlänkning av data från tidigare skilda datasets/verksamheter, samt att förbättra teknik (sensorbeteenden, produkter och tjänster) och dels metoder och beteendemönster.

Tillhör: KTH Live-In Lab
Senast ändrad: 2020-10-13