Zoals je misschien al vermoedt na opdracht 6-2b gedaan te hebben, komt de data van DBpedia direct van Wikipedia. Een groot deel van de data op DBpedia komt uit de infoboxes op Wikipedia, de rechthoekige informatieblok rechts bovenaan de pagina's, want de informatie die daarin staat is gestructureerd. De data bij de velden dbpprop:abstract en rdfs:comment is meertalig, want het maakt gebruik van de links naar de pagina's in andere talen op Wikipedia (onderaan in de linkerbalk). De data op DBpedia kan iets afwijken, want Wikipedia wordt constant veranderd door de gebruikers.
Elk feit dat op DBpedia staat is een triple, dat is een relatie tussen twee entiteiten. Daarmee kan je simpele relaties leggen tussen entiteiten, zoals "Marjan is de moeder van Klaas", want daar wordt de relatie "is moeder van" gelegd tussen de entiteiten "Marjan" en "Klaas". Deze triples zijn de bouwblokken van het Semantic Web.