Klassificera hela världen

Skriven av

Informationsarbetare? Du kanske tror att det är webbmakare, programmerare och reklampjuttar som är informationsarbetarna och att vi först nu har kommit in i informationsåldern? Det är ett missförstånd. De arbetar bara inom en mycket smal nisch av informationssamhället.

Den verkliga informationsarbetarna är bibliotekarierna. De måste ha kunskaper om alla ämnen för att kunna klassificera de böcker och artiklar vi andra ska hämta våra kunskaper ur senare. Alla ämnen måste inordnas i samma system och systemet måste ge ett enkelt begrepp, ett tal (som 005.44, operativsystem) eller en bokstavskombination (Pubdbz) som resultat, som är lätt att minnas och lätt att knappa in i en databas.

För att gå till botten med detta går vi genom portarna till Kungliga Biblioteket i Humlegården i Stockholm, rakt in i stora tempelhallen.

Kunskapens tempel

Avsikten med ett klassifikationssystem är att klassificera all mänsklig kunskap! Att göra ordning i alla de förvirrade skrifter och utgåvor som mänskligheten producerar och sortera dem på ett sådant sätt att man kan hitta i hyllorna efteråt. Man klassificerar skrifter för att göra det möjligt att finna en bok utifrån författarens namn, titeln eller ämnet och för att kunna redovisa vad som finns av en viss författare, inom ett visst ämne eller inom en viss typ av litteratur.

Biblioteken har inte alltid haft samma ordning på böckerna som de har idag och det har inte alltid varit givet att alla bibliotek inordnat en och samma bok i en och samma kategori. Och det är det fortfarande inte. Olika länder, företag, skolor och universitet har olika system, allmänna eller specialutvecklade och för det mesta inkompatibla. Alla biblioteksvärldens skarpa hjärnor har arbetat ända sedan mitten av 1800-talet med att få ordning på allt mänskligt vetande och det har resulterat i ett antal olika klassifikationssystem, varav Dewey decimalklassifikation (DDK), eller på originalspråket Dewey Decimal Classification (DDC), är den mest avancerade, heltäckande och mest spridda i världen. Den har översatts till över 30 språk, de senaste är vietnamesiska, arabiska och svenska. Ungefär 200.000 bibliotek använder sig av systemet. Studiet av DDK innebär en fascinerande utflykt i kunnandets värld.

Va? Bibliotekens klassifikationssystem? Nu har Städje spårat ur totalt. Vad är det för kul med det, undrar du.

Vänta bara tills du träffat Kungliga Bibliotekets (KB) klassifikationsansvariga Harriet Aagaard och Olof Osterman och hört dem berätta om Dewey decimalklassifikation. Harriet arbetar vid Svenska Deweyredaktionen och inleder med att berätta vad de har DDK till.

– Vi klassificerar allt mänskligt vetande.

– Jag ryser. Säg det igen!

– Vi klassificerar allt mänskligt vetande.

Klassifikationssystemens ursprung och historik

DDK skapades av Melvil Dewey redan 1876, en amerikansk förgrundsfigur inom biblioteksutveckling och biblioteksteori. Systemet är sålunda väldigt gammalt, men är nu inne på 23 upplagan, från 2011. Systemet har utvecklats från att vara en enkel lista till ett komplicerat system där man kombinerar en lista med olika tabeller.

I början av 1900-talet började man på olika bibliotek diskutera behovet av ett allmänt klassifikationssystem, så att flera bibliotek skulle använda sig av samma system. I Norge resulterade det i att man började med Dewey redan på tidigt 1900-tal. I Sverige resulterade det istället i att man skapade ett eget system, det sk SAB-systemet (Sveriges Allmänna Biblioteksförenings klassifikationssystem) som var färdigt 1921. Du har säkert sett början av listan, A – Bok- och biblioteksväsen, B – Allmänt och blandat, och så vidare.

Under 1980-talet vidareutvecklades SAB och då funderade man på om det var så bra att Sverige hade ett eget system. Sedan dess har man funnit att det blivit allt viktigare att återutnyttja katalogposter från andra länder (internationalisering, att slippa katalogisera en bok om igen) och då är det en väldig fördel att ha samma system som i andra länder.

Bibliotek i mer än 138 länder använder DDK och mer än 60 nationalbibliografier (en sammanställning av alla böcker som utges i ett land) har deweyklassningar. De flesta bibliotek i exempelvis England, Italien, Norge och Australien använder DDK även om det finns specialsamlingar med andra klassifikationssystem. I exempelvis USA används DDK på folkbiblioteken medan universitetsbiblioteken istället använder samma system som Library of Congress (LC). Det finns länder som nyligen har börjat med DDK, som exempelvis Tyskland, men där används det bara på Nationalbiblioteket, medan de tyska folkbiblioteken har ett system och universitetsbiblioteken ett annat.

– Är det bra? frågar vi.

– Tyskland är ett mycket större land än Sverige. För Sverige är det i alla fall inte bra att ha olika system. I mitten av 2000-talet gjordes en stor klassifikationsutredning för de forskningsbibliotek som är med i organisationen Libris och katalogiserar sina böcker i den gemensamma databasen Libris. 2008 tog riksbibliotekarien på KB beslut om att man skulle gå över till DDK. Därefter har många forskningsbibliotek följt med. Svenska Biblioteksföreningen rekommenderar att folkbibliotek och skobibliotek ska gå över till DDK, men det har gått trögt. 2011 började övergångsarbetet för KBs del.

UDK, Universell Decimalklassificering är ett annat system som kom år 1905 och utvecklades av två fransmän. De hade sett DDK, som då bara var en enkel lista, och var inte nöjda med det, utan ville ha ett flexiblare system. UDK används på cirka 150.000 bibliotek i 130 länder och är vanligare än DDK i Östeuropa.

Olika åsikter

– Vem bestämmer hur DDK ska vara ordnat?

– Det finns en deweyredaktion på Library of Congress (LoC) som ingår i ett världsomspännande råd för bibliografiska frågor där man tar besluten. Motsvarande organisation finns för europeiska bibliotek. Skulle någon vilja införa en förändring diskuterar man det med landets deweyredaktion och sedan får det tas upp på internationell basis.

Principen för klassifikation

Man skulle kunna tro att klassifikation går till så att man fyller i en mall med allt mer specialiserade uppgifter, som när man bygger upp ett datorkommando:

DIR [enhet:][sökväg][filnamn] [/A[[:]attribut]] [/B]

men så är det inte. Verkligheten är kringelkrokigare än så. Det börjar enkelt, med tio huvudklasser från 0 till 9.

Kunskapens träd har tio grenar där kunskapens frukter hänger. Varje huvudgren delar sig i mindre undergrenar och de delar sig i ännu flera undergrenar. Men sedan blir det mera komplicerat och trädgårdsmästaren har tvingats ympa in helt nya grenar (tabeller) med nya egenskaper här och var. Hela den mänskliga kunskapen kan inte klassificeras så lätt, utan det tillkommer tilläggssiffror som måste slås upp i tabellverk och ibland lägger man till flera tabelluppslag efter varandra.

Deweys träd är inte heller det enda i skogen. Det finns som sagt många andra, som SAB, UDK, Library of Congress Classification, Nippon Decimal Classification och så vidare. Dessutom växer det fullt av buskar runt omkring, kallade speciella klassifikationssystem, som bara täcker upp ett mindre ämnesområde, som datorer eller kemi osv. Dessa buskar odlas och beskärs till exempel av universitet med särskilda inriktningar, eller av företag som samlar litteratur inom sin nisch.

Kraftigt förenklat kan uppbyggnaden av en deweykod se ut som ovan. Men som du ska se av det fortsatta finns det väldigt många tilläggsregler som gör detta till en överförenkling.

Uppbyggnaden är emellertid entydigt förklarad i regelboken.

Att klassificera

– Man får börja med att göra en ämnesanalys och ta reda på vad boken handlar om. Det kan vara ganska knepigt ibland. Sedan får man bestämma sig för vilket ämne det är, eller välja ett tvärvetenskapligt ämne. Menar författaren att det är en roman och förlaget annonserar ut boken som en roman, klassificerar man det som en roman, även om författaren använder sitt eget namn i texten och det tycks handla om hans liv, säger Olof.

Ett exempel på felklassificeringar är Jan Myrdals böcker som först sattes som biografier eftersom hans eget namn fanns med i texten, men han själv ville att de skulle kallas romaner. Det slutade med att böckerna fick båda klassningarna.

För att ämnesorden som används inte ska bli för vildvuxna finns den svenska ämnesordsredaktionen, som arbetar med listan Svenska ämnesordssystemet. Den har inget med DDK att göra utan är en anvisning om vilka termer som ska användas vi klassifikation, för att eliminera närliggande termer.

Tio huvudklasser

Dewey består av ett schema som är grunden för nummerbyggnaden. Numret eller koden börjar med tio huvudklasser. Numren är alltid minst tre siffror långa och nollor används för att fylla ut kortare nummer. De tio huvudklasserna (000-900) är följande:

000: Datavetenskap, information och allmänna verk
100: Filosofi och psykologi
200: Religion
300: Samhällsvetenskaper
400: Språk
500: Naturvetenskap
600: Teknik
700: Konst och fritid
800: Litteratur
900: Historia och geografi

Varje huvudklass har sedan 100 avdelningar (000-990), varur vi väljer huvudklass 7:

700: Konst
710: Landskapskonst och fysisk planering
720: Arkitektur
730: Skulptur, keramik och smideskonst
740: Teckning och konsthantverk
750: Måleri
760: Grafisk konst
770: Fotografi och datorkonst
780: Musik
790: Idrott, spel och underhållning

Vilket totalt ger en möjlighet till 1000 sektioner eller basnummer (000-999). Vi fortsätter med samma exempel som ovan:

720: Arkitektur
721: Arkitektonisk struktur
721: Arkitektonisk struktur
722: Arkitektur före ca år 300
723: Arkitektur från ca är 300 till 1399
724: Arkitektur från år 1400
725: Offentliga anläggningar
726: Byggnader för religiösa ändamål
727: Byggnader för utbildning och forskning
728: Bostadshus och liknande byggnader
729: Formgivning och utsmyckning

Sen kommer vi ned på detaljnivå och då blir det besvärligt, för då tillkommer kategorier. Här är ett exempel ur avdelningen 720, arkitektur:

722.52: Forntida persisk arkitektur
725.51: Allmänna sjukhus- och sanatoriebyggnader
727.8: Biblioteksbyggnader

– Arkitektur i Sverige skulle bli 720.9485, där 72 är arkitektur i allmänhet (tvärvetenskaplig kod) nollan är utfyllnad för att få tre siffror, 9 kommer ur tabell 1 och betyder att ämnet har geografisk aspekt, medan 485 är landskoden för Sverige. Det är lite pyssligt. Ibland kan det till exempel stå i schemat att man ska lägga till en kod från tabell 2 direkt, till exempel för folkbibliotek, och det beror på att det kan finnas andra delar i schemat som är upptagna. Detta gör att det blir mera komplicerat. Man kan inte omedelbart veta att 027.4485 är folkbibliotek i Sverige, medan man ganska omedelbart kan begripa att 720.9485 är just arkitektur i Sverige. Till vissa ämnen kan man lägga till vad som helst efteråt. Till exempel till journalistik (070, Nyhetsmedia, journalistik och publicering) till basnummer 070.449 – särskilda ämnen inom journalistik kan man lägga till vad som helst, som 027.42 som anger uppsökande biblioteksverksamhet vilket ger koden DDK 070.44902742, säger Harriet, som om det vore en baggis.

Men det räcker inte, utan det måste till andra bestämningar som standardindelningar av vilken sorts skrift det rör sig om, vilket geografiskt område eller folkslag, vilka konstarter, språk och språkfamiljer etc. För den skull har man sex tabeller som man, eller snarare som en dator, kan slå upp i och plocka värden ur.

T1: Standardindelningar (filosofi, teori, lexikon, periodica, organisationer, utbildning, forskning, historia etc)
T2: Geografiska områden, historiska perioder, personer, biografier
T3A-C: Indelningar för konstarterna, särskilda litteraturer, särskilda litteraturformer
T4: Indelningar för särskilda språk och språkfamiljer
T5: Etniska och nationella grupper
T6: Språk

Värden ur T1 kan alltid användas efter basnumret, andra får bara användas efter särskild anvisning i regelboken. Här är några regler:

Tabell 1 får alltid användas (om det inte uttryckligen står något annat i regelboken)
Tabell 2 kan användas via kod –09 (historia) från tabell 1.
Tabell 5 kan användas via kod –089 (grupper, folkslag) från tabell 1.
Tabell 3, 4 och 6 används efter anvisning i regelboken.

Ett exempel är tabell T2, geografiska områden, där Sverige läggs till som landskoden 485. I tabell 5 har svenskarna som folkslag emellertid koden 397. Man skulle kunna tro att det är superlogiskt och hierarkiskt, men tyvärr inte, för Sverige finns också under huvudklass 9, sålunda:

948: Skandinavien
948.1: Norge
948.5: Sverige
948.6: Götaland
948.7: Svealand
948.8: Norrland
948.9: Danmark och Finland

För att uttrycka Halland eller Stockholm måste man bygga ut med hjälp av T2. Utbyggnad av Sverige utöver Götaland, Svealand och Norrland görs inte i andra länder. Danmark och Finland är inte med i dewey-samarbetet och blir därför styvmoderligt behandlade på detta sätt.

Tabellerna är mycket komplexa och det skulle föra för långt att ta med dem i sin helhet här. Mera information om tabellerna hittar du på Internet på KBs webbsida (se referenserna).

Efter detta kommer suffix för typ av publikation, där exempelvis 05 är periodica (tidningar). Efteråt brukar man lägga till versionsnumret för den DDK-utgåva man använder och dess språk, som ”23/swe”.

Kan du bygga en DDK-kod nu? Nej, förmodligen inte. De här uppgifterna räcker inte på långt när för att en oerfaren ska kunna bygga en fullständig kod. Det krävs utbildning. Sådan kan du få hos KB som har veckokurser i ämnet. Fast du förväntas ändå inte kunna bygga en fullständig kod själv, utan det finns datoriserade hjälpmedel för det.

På svenska heter tjänsten Webbdewey, som man tyvärr bara får tillgång till om man skaffat lösenord från KB.

Men schemat innehåller ännu flera tilläggstabeller. Man kan ta stickade tröjor som exempel. Man tar basnumret för stickning 746.432 och får då en hänvisning till en tilläggstabell där man får nummer 0432 som innebär kläder och omfattar tröjor. Deweykoden blir sålunda DDK 746.4320432.

Dessutom finns prioriteringstabeller som talar om vilket man ska välja i första hand om boken avhandlar två ämnen. Generellt ska man välja det ämne boken mest handlar om, annars ger schemat anvisningar om vad som ska väljas. Man kan till exempel betrakta kläder som ett ämne, men ämnet har många olika aspekter. Kläder kan inordnas under hemsömnad, kommersiell tillverkning, konst, produktsäkerhet, seder och bruk (dock ej folkdräkter). Hittar man ingen särskild aspekt använder man det tvärvetenskapliga numret. En bok kan ju både behandla hur man syr kläder, samt ha en konstnärlig synvinkel, och hur de används. Då hamnar den på kod 391 (Seder, etikett och folklore). Väldigt många böcker om mode får kod 391 och hamnar inte under konst på Grafiska konstformer och konsthantverk som har kod 740.

Kulturella skillnader

En boks klassificering kan var kulturellt bunden. Och det ändras med tiden. Böcker om aborter har flyttats från sociala problem och finns numera under medicin. Det är särskilt problematiskt i USA där abortmotståndarna stänger abortkliniker av religiös anledning, men dewey-kommittén är väldigt öppen för att systemet ska fungera i hela världen.

Dessutom finns regionala utbyggnader av DDK. Ett bibliotek i Alexandria måste kunna klassificera sin litteratur om islam medan vi vill kunna klassificera på svenska kommuner, något som egyptierna aldrig skulle bry sig om. Därför finns det inte med i egyptiska DDK. Däremot kan till exempel renskötsel utmärkt få plats i alla utgåvor.

Användandet av DDK gör också att om man får förklassificerade böcker från andra länder så kan man veta att de är klassificerade på samma sätt vi skulle ha gjort det.

Otidsenliga klassifikationer

– Då och då förändras tekniken och ämnen föråldras. Vad händer när en klassificering blir otidsenlig? Böcker om elektronrör, som står under SABs P (teknik) borde egentligen flyttas till K (historia), menar vi.

– Då gör man en förflyttning eller utbrytning. Då markerar man att böcker med en kod har flyttats till ett annat ställe, varefter det dröjer ett bra tag innan den koden kan användas igen. Den blir spärrad och får en hänvisning till en annan kod. I praktiken kommer de flesta bibliotek inte att ändra befintligt material utan kommer bara att ändra nyinkomna verk, säger Harriet.

– Men behöver man inte möblera om rent fysiskt i biblioteket också?

– När det gäller just teknikböcker som blir omoderna, brukar de magasineras och då spelar koderna ingen roll, bara man kan hitta dem. Men på folkbiblioteken blev den en ordentlig fysisk omflyttning när man till exempel nyligen flyttade alla böcker om fotografer från teknik till konst.

EXEMPEL PÅ KLASSIFIKATIONER

Teknikaliteter 2

– KB har redan klassificerat undertecknads tidskrift Teknikaliteter 1 (DDK: 004.605 23/swe, där 004 är datavetenskap, anvisad kategori 6 som är gränssnitt och datakommunikation, samt suffixet 05 eftersom det är en tidskrift, periodica) eftersom den mest handlar om datorer, menar Olof.

– Den handlar inte alls om datorer, invänder vi, som har detaljkunskaper.

– Det kan nog bero på bristande förståelse för ämnet. Vi tittade nog mest på aspekten om datakommunikation.

94 råd för dig som har Novells nätverk

Undertecknads klassiska verk ”94 råd för dig som har Novells nätverk” har fått två koder från svensk DDK-utgåva 22, nämligen DDK 004.6 22/swe (datakommunikation) och DDK 005.44 22/swe (operativsystem, särskilda) och tittar man på posten i databasen Libris så står det ”(machine generated)” vilket betyder att DDK-koden automatgenererats genom en tabelluppslagning eftersom boken från början klassificerats i SAB-systemet med koderna Puck (datakommunikation) och Pubdbz (Novell Netware). Då bryr man sig inte om att försöka klassificera om böckerna, utan låter en dator slå i en fördefinierad tabell.

Djävulsbibeln

– Ska man klassa Djävulsbibeln som en bibel så är det en bibel översatt till latin och då blir det DDK 220.47. Bibeln har en egen sektion med nummer 220. Den är dessutom en handskrift och det finns bara en kod för handskrifter, nämligen DDK 091, säger Olof.

Jorden runt på 80 dagar

Koden för Jules Vernes ”Jorden runt på 80 dagar” är specialbyggd för fransk litteratur för denna tidsperiod: franska romaner och noveller 1848-1899.

Koden blir DDK 843.8 där 8 är huvudklassen Litteratur, 4 betyder fransk litteratur och 3 särskilda former – romaner och kategorin 8 anvisar tidsperioden.

Man kan inse att det inte finns något enkelt sätt att bygga en kodsträng för skönlitteratur. Läget är besvärligt. Huvudklass 800 innefattar både litteraturvetenskap (SABs G) och skönlitteratur (SABs H). Där kan det bli knepigt när man letar på enskilda författare. En bok om en författare har samma kod som en bok av en författare. Dessutom använder man samma kod för en bok på olika språk. Men i katalogposten i databasen lägger man då till en språkkod.

Clas Ohlson-katalogen

Clas Ohlsons postorderkatalog, ett verk som åtminstone tidigare borde funnits i var mans bokhylla, klassificeras som teknik, som samtidigt är inriktad på privatpersoner och hemmet, varför den hamnar under hemkunskap. Postorderkataloger klassificeras som kommersiellt diverse, genom en hänvisning i schemat som hänvisar oss dit.

Koden blir DDK 640.29 där huvudklassen 6 är Teknik, sektionen 640 hemkunskap och familjekunskap och kategorin 29 är postorderkataloger.

En porrtidning

Ämnesordet ”amatöranatomi” föll inte klassificeraren i smaken, utan han pekade mera på sexualitet eller sexualvanor. Här utbryter en intressant diskussion mellan de båda skriftlärda. Ska den klassas som kontroversiella frågor kring allmän moral och sedvänjor, eller obscenitet och pornografi?

Koden blir slutligen DDK 306.77 där huvudklassen 3 är Samhällsvetenskaper och sektionen 306 är den tvärvetenskapliga koden. Kategorin 77 betyder sexualvanor.

Men datavetenskapen i klass noll?

– Vän av ordning frågar sig varför verk om datavetenskap har förvisats till grupp noll, när de hade passat bättre i grupp sex, tillsammans med medicin och teknik? undrar vi.

– Det fanns helt enkelt ledigt utrymme i klass noll. Systemet är pragmatiskt. Men det finns mycket i datavetenskapen som passar under informationssystem och liknande. Så är det även i SAB-systemet, avslutar Harriet Aagaard.

Avslutning

Att lura ut vad som verkligen ligger bakom en kryptisk titel på en bok eller en vetenskaplig avhandling på något udda språk och se till att den blir korrekt sökbar, är en prestation! Det som de klassifikationsansvariga ägnar sig åt är inte informationsförvaltning utan informationsförädling.

Läs mer

Kungliga Biblioteket: https://www.kb.se/

Katalogisatörens verktygslåda: https://metadatabyran.kb.se/

Deweysystemets officiella hemsida: https://www.oclc.org/en/dewey.html

Alla deweykoder: https://en.wikipedia.org/wiki/List_of_Dewey_Decimal_classes

Melvil Dewey: https://sv.wikipedia.org/wiki/Melvil_Dewey

Om Dewey-tabeller: https://deweybloggen.blogg.kb.se/

Om katalogisering: https://www.kb.se/samverkan-och-utveckling/libris/katalogisering-i-libris.html

Andra system

SAB: https://sv.wikipedia.org/wiki/SAB:s_klassifikationssystem

UDK på svenska: http://www.taranco.eu/udk/

Library of Congress Classification: https://www.loc.gov/catdir/cpso/lcco/

ICD, International Statistical Classification of Diseases and Related Health Problems, ett annat klassifikationssystem, denna gång för alla sjukdomar och skador som kan drabba människokroppen: https://www.who.int/standards/classifications/classification-of-diseases

Specialord inom klassifikationstekniken

Bibliotekarierna ruvar på en egen samling fackord. Dessa är olika i Sverige och andra andra länder. Här är några.

Call number – hyllsignum, ett serienummer på en hylla i ett bibliotek som ska underlätta letandet.

Citeringsordning – en ordning man bestämde att ämnesorden skulle sorteras efter i äldre system (exempel: historia-sverige-1950-talet). Idag hamnar dessa termer istället i olika fält vid databassökning. I Deweykodning sköts detta av ett datorprogram.

COP – copyrightår

Cutter – amerikanskt system för att få entydiga hyllkoder, som används för att särskilja om det blir för många böcker på samma Dewey-kod. Används bara av vissa bibliotek. Författarens efternamn torde räcka.

Fileringsordning – ett sätt att exempelvis inordna namn på ett bättre sätt än bokstavsordning. Mellannamnet ”von” läggs efter efternamnet, annars kan en författare hamna flera kataloglådor fel. Ett annat exempel är hur man ska sortera in bokstäver med accenter.

Indelningskriterier – metoden att dela in böcker i olika klasser.

Klass – samma som klassifikationskod.

Mnemonic – ett kort sätt att minnas ett ämne (”mat”) som inte har något med klassifikation att göra.

Utbrytning – (flyttning) när en större avdelning bryts ut ur en klassning. Så har till exempel fotografi flyttats från teknik till konst. Kan också kallas utbyggnad av systemet. Detta används ofta när ny kunskap tillkommer, som datavetenskap.

Årtal – bokens utgivningsår, har inget med klassifikation att göra.

Ämnesord – klassens betydelse, som ”datavetenskap” som genereras ur klassifikationen. Kan dessutom betyda ett ord i listan Svenska Ämnesord eller LC Subject Headings eller andra ämnesordssystem. Alla katalogposter har inte ämnesord. Ämnesinformation kan lika gärna hämtas ur klassifikationen.

Märken på artiklar:
Artikelkategorier:
Litteratur · Utbildning

Lämna en kommentar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *