Hvad vil du gerne læse om fra Ekstra Bladet Udvikling?

Kære læser

Denne blog har stået mere end stille. Men fra det nye år starter vi et redaktionelt udviklingsteam (du har muligvis set vores jobopslab, hvor vi søger en dygtig udvikler), som jeg bliver en del af, der skal have en blog til at skrive om dels, hvad vi laver og dels hvorfor vi laver det.

På sigt skal bloggen formentlig udvides til også at indbefatte resten af Ekstra Bladets Udviklingsafdeling, hvor jeg er ansat - så vi kan fortælle endnu mere om, hvad vi laver og få masser af gode inputs samt dele idéer og erfaringer.

Men det rejser spørgsmålet: Hvad er værd at læse?

Hvilke indlæg vil du som læser forvente at møde på en blog drevet af et redaktionelt udviklingsteam, der blandt andet skal arbejde med at lave journalistik på ekstrabladet.dk, der går et (eller flere) skridt videre end artikler med billeder? Hvor teknisk må det blive? Eller kan det blive for overfladisk?

Lad mig endelig høre. Du kan enten lægge en kommentar herunder eller sende mig en mail på lkj@eb.dk.

Lars K Jensen,
Redaktionel projektleder 

Wikileaks Iraq wardiaries data quality

(this post intentionally in English as it might interest non-danes)

til;dr: The Wikileaks Iraq data is heavily redacted (by Wikeleaks presumably) compared to the Afghanistan data: Names -- of persons, bases, units and more -- have been purged from the "Title" and "Summary" column-texts and the precision of geograpical coordinates have been truncated. This makes both researching and visualizing the Iraq data somewhat difficult.

Ekstra Bladet received the Iraq data from Wikileaks some time before the Friday 22. 23:00 (DK-time) embargo. We knew the dump was going to be in the exact same format as the Afghanistan one, so loading the data was a snap. When we started running some of the same research-scripts used on the Afghanistan data, it quickly became clear that something was amiss however. For example, we could only find a single report mentioning Danish involvement (namely the "Danish Demining Group") in the Iraq War. We had drawn up a list persons, companies and places of interest, but searches for these also turned up nothing. A quick perusal of a few sample reports revealed that almost all identifying names have been purged from report texts.

This caused us to temporarily abandon the search for interesting individual events and instead try to visualize the events in aggregate using maps. I had readied a heatmap tile-renderer which -- when fed the Afghanistan data -- produces really nice zoomable heatmaps overlayed on Google Maps. When loaded with the Iraq data however, the heatmap tiles had strange artifacts. This turns out to be because the report geo-coordinate-precision has been truncated. We chose not to publish the heatmap, but the effect is also evident on this Google Fusion-tables based map of IED-attacks (article text in Danish). The geo-precision truncation makes it impossible to produce something like the Guardian IED heatmap, demonstrating IED-attacks hugging roads and major cities.

2010-10-23_16h23_10

We did manage to produce some body count-based articled before the embargo. Creating simple infographics showing report- and attack-frequency over time is also possible. Looking at the reports, it is also fairly easy to establish that Iraqi police mistreated prisoners. Danish soldiers are known to have handed over prisoners to Iraqi police (via British troops), making this significant in a Danish context. We have -- however -- not been able to use the reports to scrutinize the Danish involvement in the Iraq war in the same depth that we could with the Afghanistan data.

We initially thought the redactions were only for the pre-embargo data dump and that an unredacted dataset might become available post-embargo. That seems not to be the case though, since the reports Wikileaks published online after the embargo are also redacted.

I'm not qualified to say whether the redactions in the Iraq reports are necessary to protect the individuals mentioned in them. It is worth noting that the Pentagon itself found that no sources were revealed by the Afghanistan leak. The Iraq-leak is great ressource for documenting the brutality of the war there, but the redactions do make it difficult to make sense of individual events.

Automatiske krimi-artikler på ekstrabladet.dk

For et par måneder siden lancerede vi Ekstra Bladets Krimikort. Krimikortet have ingen redaktionel integration, blev sjældent nævnt i artikler og fik derfor ikke ret meget traffik.

Problemet er at journalisterne skal have noget der kan indgå i det daglige nyhedsflow. Hændelserne på krimikortet hentes af en robot en gang i døgnet. Robotten har nu fået til opgave også at skrive en artikel med dagens hændelser hver dag hvor den finder nye punkter. Vi er lidt i tvivl om hvornår politiet publicerer døgnrapporter, og hvornår det er optimalt at hente dem. For tiden kører robotten hver dag kl. 12 -- på det tidspunkt synes de fleste politikredse at have publiceret rapporter med gårsdagens og natens hændelser.

Filip har skrevet en artikel om den nye funktionalitet og her er eksempler automat-artikler.

Michael Friis

Udvikler, Ekstra Bladet Research & Development

Wikileaks og Ekstra Bladet, uge 1 (og data til dig)

Natten mellem søndag og mandag frigjorde Wikileaks omkring 92.000 krigsrapporter fra Afghanistan. New York Times, The Guardian og Der Spiegel havde haft adgang til rapporterne en måneds tid, og var derfor straks klar med repportage.

Søndag aften identificerede jeg (ligesom mange andre, sikkert) i The Guardians materiale rapporten der beskriver hvad der skete da danske soldater dræbte en femårig dreng. Hændelsen var kendt, men vi havde alligevel en kort artikel i papir-avisen mandag og vores journalister skrev en online artikel mandag aften.

Rapporterne var ikke tilgængelige på Wikileaks sitet da jeg gik i seng søndag aften, men mandag morgen var de klar til download (i parentes bemærket var jeg ved at revne af spænding, og sov ikke ret meget den nat). Det meste af mandag formiddag gik med at få proppet alle data ned i en database og finde ud af hvad der var hvad.

Henover frokost gik jeg igang med at identificere 398 af de 92.000 hændelser der, med nogenlunde sikkerhed, havde med danske soldater at gøre (mere om dem senere). Henunder aften implementerede jeg et interaktivt kort, så vores læsere kunne undersøge hændelserne selv. Kortet med de 398 hændelser kunne vi lancere i en online artikel tirsdag morgen, med tilhørende full-screen kort. I løbet af tirsdagen kunne Filip Wallberg skrive yderligere et par artikler baseret på analyser af dokumenterne.

Da Filip gik hjem over middag tirsdag, gik jeg i gang med at hjælpe papir-journalisterne med at lave dækning til onsdags-avisen. Vi tog udgangspunkt i de 398 dansker-hændelser og sammenholdt hvad der stod i Wikileaks rapporterne med hvad Hærens Operative Kommando havde fortalt. Det blev til tre avis-sider, hvoraf kun noget er på nettet.

Onsdag lykkedes det Filip (ved hjælp af Maptimize) at bakse alle 92.000 hændelser på et Google kort og publicere dem.

Til torsdags-avisen kiggede vi på forholdene mellem fjendtlige, civile og danske døde, og spurgte om tabene var for høj en pris.

Torsdag tog jeg forskellige kodestumper, jeg havde brugt til at hjælpe grafikerne med at lave kort tirsdag, og brugte dem til at publicere et kort med de danske soldaters hårdeste kampe.

Med andre ord havde vi rigtig meget glæde af de 398 hændelser. Udvælgelsen af hændelserne er ret simpel. Jeg fandt dem ved at søge i rapport-titel og tekst efter ordene "Danish" eller "DNK". Et af felterne i databasen hedder "UnitName" og jeg fandt yderligere dansker-hændeler ved at søge efter "JDR" (Jydske Dragonregiment), "GHR" (Garderhusarregimentet) og "2 L RECCE SQN" (2. lette opklarings eskadron) i dette felt.

Et regneark med hændelserne er vedhæftet denne post -- download arket og se hvad du kan få ud af det.

Er det så alle hændelser i Wikileaks data hvor danske soldater har deltaget? Bestemt ikke. Bl.a. figurerer de meget hårde kampe i Musa Qala i 2006 stort set ikke. Dengang kæmpede de danske tropper under navnet "Task Force AEGIS" og bliver ikke fanget af mine kriterier.

For at vække interessen, er her et par uddrag fra regnearket. Vi har en kort ordforklaring på denne artikel:

"LN child was brought to FOB ARMADILLO with head and stomach injuries perhaps caused by grenade frags. MM(S) 05-28C was assigned. While waiting for MEDEVAC, child died. OC C Coy in FOB ARMADILLO is now investigating circumstances of injury and if it was related to earlier TIC CF involved"

http://krigsjournal.ekstrabladet.dk/event/55594

"FF HEARD AN EXPLOSION IVO GR 41RPR 30600 15700 CLOSE TO THEIR POSITION. ON SCENE THEY NOTICED LN PULLING 3 X DEAD LN'S AND BODY PARTS FROM VEH."

http://krigsjournal.ekstrabladet.dk/event/66097

"At approximately 12 1410 D* October 09, a group of 30 Aghan civilians brought 3 wounded Afghan civilians to Forward Operating Base Joboland that they claimed were injured by coalition forces. The wounded were a 5 year old male with a gun shot wound to the head (presumed dead), a 10 year old female with a gun shot wound to the left inner thigh one civilian (gender, age not specified) with a fracture to the lower right leg."

http://krigsjournal.ekstrabladet.dk/event/69387

"At about 1845D*, 20-25 men from the area of the incident arrived at BLUE 29 in order to inform the DNK Coy about the incident. They had with them 1 x wounded child and 1 x dead child. The men informed the DNK Coy that there was a further 4 (elderly) casualties who had been taken direct to LKG hospital. This is yet to be verified."

http://krigsjournal.ekstrabladet.dk/event/51160

Ekstra Bladet kigger videre i Wikileaks dumpet, følg med i næste uge.

Michael Friis

Ekstra Bladet Research & Development

Click here to download:
DanishWarLogs.xlsx (185 KB)
(download)

Facebook Open Graph på ekstrabladet.dk

Lige inden VM lykkedes det os at lave en -- synes vi selv -- ret snedig implementation af Facebooks nye Open Graph protokolekstrabladet.dk. Open Graph går ud på at man opmærker sider på sit site således at Facebook-brugere kan 'like' dem ('synes om' på dansk), ligesom de kan synes om gængse Facebook-sider.

En simpel Open Graph implementation giver brugere mulighed for at synes-om artikler samt evt. forside og sektionsforsider, men vi er gået lidt videre og har skabt sider for alle 700-800 spillere der deltager i fodbold-VM. For at gøre det let for vores læsere at synes-om spillerne embedder vi mouse-hover 'synes-om' links på alle spillernavne i artikler i VM-sektionen. Du kan se hvordan det virker i denne artikel som Lars K Jensen har skrevet til vores læsere.

Like

Når en læser synes-om en spiller dukker en meddelelse op i brugerens feed, ligesom når man synes-om facebook pages. Det smarte (set fra Ekstra Bladets synspunkt) er at vi nu har mulighed for -- via Facebook -- at sende opdateringer til Facebook-brugere der synes-om fodboldspillere på ekstrabladet.dk. F.eks. poster "Nicklas Bendter på ekstrabladet.dk" en artikel til sine fans hver gang vi skriver en ny artikel om ham. Du kan se hvordan det ser ud for brugerne herunder (det er Messi der skriver til sine fans).

Likeshot

Bag scenen er spillerne koblet op til en større semantic web infrastruktur så vi ved at den "Lionel Messi" der lige nu spiller for det Argentinske landshold er den samme der til efteråret spiller for FC Barcelona.

Forhåbentligt kan vi med vores Open Graph integration give vores læsere opdaterede nyheder om emner de går op i, direkte i deres news-feeds på Facebook. Vi kigger selvfølgelig på hvad vi ellers kan bruge denne priviligerede adgang til folks feeds på. Ligefor er det f.eks. at give læserne redaktionelt udvalgte betting-forslag for kampe der involverer sports-hold de er fans af -- ligesom vi allerede gør på ekstrabladet.dk.

Vi har allerede udvidet mængden at begreber man kan synes til bands der spiller på Roskilde Festival (se f.eks. denne artikel) og vil gerne udvide det yderligere til f.eks. produkter og feriedestinationer. Dem af vores brugere der synes om disse emner når vi skriver om dem, kunne så modtage (redaktionelt udvalgte) forslag til steder hvor produkter og rejser kan købes (vi skal lige have tjekket med markedsføringsloven og Facebooks vilkår om den slags er OK). I det hele taget giver Open Graph protokollen en god mulighed for at lære mere om vores læseres passioner og en meget spændende kanal for at levere personaliseret indhold pladask i deres Facebook feeds.

Er der ingen ulemper? Jo bestemt. Vi er meget i tvivl om hvordan vi mest bekvemt giver læserne mulighed for at synes-om begreber der optræder i artikler. I starten gjorde vi begreberne til blå links og placerede et lille Facebook-tommeltot ikon ved siden af, men det fandt en del af vores læsere forstyrrende (se kommentarer). Nu er tommeltotten borte, og der er blot et blåt link. Vi overvejer i stedet at tilføje en boks i bunden af artiklen der opremser alle begreberne, så de let kan 'likes' efter endt læsning.

En anden ulempe er at mængden af opdateringer vi leverer i vores læseres feeds kan blive for stor. Under VM kan den sammen spiller f.eks. sagtens optræde i 5 forskellige artikler på en enkelt dag. Derfor overvejer vi at nøjes med at udsende daglige "digests".

En tredje ulempe er at det i princippet ikke er Ekstra Bladet der oparbejder viden om læserne, men Facebook. Vi må dog erkende, at selv om vi har en masse bruger-identiteter via Nationen!, så er publikum større og lettere tilgængeligt via Facebooks veldesignede API'er. Den direkte adgang til Facebook-brugeres news-feeds er også uvurderlig. Dertil kommer at Facebook giver os ret gode muligheder for at trække information om hvordan læserne (via Facebook) interagerer med indhold på vores site.

Vi lover at holde bloggen opdateret med vores Open Graph erfaringer. Jeg (Michael Friis) forventer desuden at skrive en teknisk post om implementationen på min personlige blog snarest.

Michael Friis

Ekstra Bladet Research & Development

Data om Lægers Bijob

Ekstra Bladet kører i dag en kampagne om danske lægers bijob for medicinalindustrien. Kampagnen er delvis baseret på data fra denne liste på Lægemiddelstyrelsens hjemmeside. Hvis du er interesseret i at bruge data til et eller andet, og orker du ikke at scrape det selv, er her et Google Spreadsheet med alt data sorteret på relevante måder (direkte link).

 

Michael Friis

Ekstra Bladet Research & Development

 

 

Hvordan linker vi bedst (i forhold til den menneskelige hjerne)?

http://www.wired.com/magazine/2010/05/ff_nicholas_carr/all/1

Forfatteren Nicholas Carr har skrevet denne artikel for Wired.

En af hovedkonklusionerne er, at links inden i selve teksten forstyrrer læseren og forhindrer vedkommende i at komme i dybden med stoffet. Uanset hvad, skal der træffes en beslutning, som minimum beslutningen om ikke at klikke på et link. Og det forvirrer læseren.

Undersøgelser fra både 1989, 1990 og 2007 understøtter dette.

Jeg vil på det stærkeste anbefale, at du læser artiklen igennem, den har nogle rigtig, rigtig interessante pointer.

Læs artiklen i sin fulde længde.

Lars K Jensen,
Redaktionel Projektleder - ekstrabladet.dk

Community Manager til site for unge

Ekstra Bladet søger community manager til et ny online community for unge. Du kan læse det officielle job-opslag, men der står en masse mærkeligt gas. Det vigtigste at vide er, at vi søger en ret ung person (nok en pige) der kan opbygge et online community helt fra bunden. Vedkommende skal have styr på det der med sociale medier og instinktivt vide hvad der får communities til at tikke.

Hvis du har spørgsmål er du velkommen til skrive en kommentar her eller til at ringe til Nana på tlf. 2071 4770.

Ekstra Bladet Krimikort lanceret

Så har jeg fået skubbet et lille sideprojekt ud over rampen: http://krimikort.ekstrabladet.dk/

Punkterne på kortet kommer fra Politiets døgnrapporter. De downloades og skilles ad en gang i døgnet. Hændelserne geokodes og kategoriseres efter bedste beskub (skriv gerne en kommentar her hvis du finder hændelser der er mangefuldt kategoriseret eller geokodet).

Hvorfor har jeg bygget det? Det er ret simpelt: Jeg har lavet Krimikortet for at gøre folk bange for at gå udenfor, for at få dem til at se mere TV og for at få dem til at stemme mere på Dansk Folkeparti.

Michael Friis

Ekstra Bladet Research & Development

Hvordan integrerer et netmedie bedst Facebooks "Like"-knap?

Som jeg skrev den 23. april, har vi på ekstrabladet.dk implementeret en række af Facebooks nye Social Plugins, deriblandt “Like”/”Synes godt om”-knappen.

Siden har også berlingske.dk implementeret “Like”-knappen, så man nu også kan klikke “Like” til artikler der. En række internationale sites, blandt andet teknologi-bloggen TechCrunch, har også fået knappen på.

Der er dog et potentielt problem i denne måde at integrere knappen i artikler på. Læser man dokumentationen for OpenGraph-protokollen, som “Like”-knappen er en del af, står der til sidst:

Make only real-life things into objects. Users don’t want news articles and other transient content as objects on their profile.

Der linkes godt nok til “Like”-knappen, som noget man kan bruge til at “enriche” denne type af URL’er (altså nyhedsartikler), men grænsen må være hårfin for, hvornår er noget “bare” en artikel med en Like-knap, og hvornår er man ude i at arbejde med Open Graph-protokollen?

Årsagen til, at Facebook gerne vil lave dette skel er, at alt, hvad man klikker “Like” til optræder på ens profil, tilsyneladende. Ellers er der nogle yderligere meta-tags, som gør, at vi nu befinder os i Open Graph-protokollen og ikke blot i “Like”-knappens univers, så at sige. Der mangler vi noget klar dokumentation fra Facebook om, hvad forskellen helt præcis er.

Derudover giver Open Graph-protokollen også mulighed for, at man kan skrive opdateringer direkte til dem, der har klikket “Like” på et eller flere af de objekter, man har på sit website.

Facebook skriver selv følgende om, hvad det kræver at arbejde med Open Graph-protokollen:

To turn your web pages into graph objects, you’ll need to add Open Graph protocol <meta> tags and the Like button to your webpages.

The tags allow you to specify structured information about your web pages. The more information you provide, the more opportunities your web pages can be surfaced within Facebook today and in the future.

Det klargør jo ikke yderligere, hvor grænsen går for, hvad der er “best practice” (i forhold til Facebook) for os, der publicerer adskillige artikler hver dag.

Hvordan skal vi bruge “Like”-knappen? Skal vi binde den op med “real-life things” (såsom de personer og steder, vi skriver om) eller fortsætte, som vi gør nu, hvor der er en “Like”-knap på artiklerne?

Vi er kun i begyndelsen af at forstå de muligheder, som værktøjer som dette åbner op for - sammen må vi finde den optimale måde at bruge dem på, både for os selv, brugerne og Facebook :-)

Lars K Jensen,
Redaktionel Projektleder, ekstrabladet.dk