The blogs in the blogmix are selected through the lists Most visited private blogs, Most visited professional blogs, and the local lists for different regions, at bloggportalen.se.
More information, such as the location and age of the blogger is also retrieved from Bloggportalen. The material has not been manually checked, which means that spam may occur. Some English blogs have been removed when discovered, and some blogs have not been added for technical reasons.
The time of the blogs ranges from the first to the latest entries of the selected blogs, and the corpus is continually updated.
The material is sentence scrambled.
Urvalet av bloggar för bloggmixen görs med hjälp av topplistorna på bloggportalen.se, både Mest besökta privata bloggar, Mest besökta proffsbloggar och de lokala topplistorna för olika regioner.
Närmare information, som bloggarens ort och ålder, hämtas också från Bloggportalen. Materialet har inte kontrollerats manuellt, vilket betyder att det kan förekomma spam. Några engelskspråkiga bloggar har plockats bort då de upptäckts, och vissa bloggar har inte kunnat läsas in av tekniska skäl.
Tidsperioden sträcker sig från de första inläggen i de utvalda bloggarna till de senaste inläggen. Korpusen uppdateras regelbundet.
Materialet är meningsomkastat.