The high-resolution (1:10,000) hybrid topsoil plant-available phosphorus map was produced by combining: (a) arable-land polygons with the median topsoil P value, (b) the machine learning bagging model based predicted values for agricultural lands with missing or limited sampling data, and (c) the two-parameter soil–land use ordination matrix-based model values for forests, wetlands and peat extraction sites.
Soil phosphorus data available for agricultural soils were obtained from the PANDA database, which contains regular soil monitoring and voluntary soil sampling data by farmers. The database contains soil sampling data collected from agricultural lands for the period 2005–2021 and is managed by the Centre of Estonian Rural Re-search and Knowledge. For this period in the PANDA database, there are data about 387,904 composite soil samples all over Estonia, including topsoil phosphorus content (mg/kg). Composite soil samples in the PANDA database were collected by licensed personnel following the same prescribed sampling strategy (prescribed sampling route and sampling density, depth, and volume) and analyzed in the same laboratory using the Mehlich-3 method.
There are no similar comprehensive topsoil phosphorus content databases for other land-use categories available in Estonia. Comparable values of topsoil phosphorus content for other land-use types (forest, wetland, peat extraction areas, and quarries) by soil types were searched through a literature review of scientific papers, reports, the Estonian Environmental Monitoring System database, and supplemented by original unpublished datasets of the authors. Topsoil P concentration in the forest and peatland soil samples collated from multiple studies and literature sources were determined with various methods (Aqua Regia, Olsen, and Kjeldahl), and, thus, conversion coefficients based on Kulhánek et al., 2009 and Wolf and Baker, 1985 were used to convert phosphorus content to the same level with the Mehlich-3 method prior to statistical analysis.
We used more than 388,000 topsoil plant-available phosphorus (P) samples to study spatial and temporal variability and land-use effect on soil P content. We developed a mapping approach based on existing databases of soil, land-use, and fragmentary soil P measurements by land-use classes to provide spatially explicit high-resolution estimates of topsoil P at the national level.
The topsoil P content (mg/kg) for each soil–land use unit of eight agricultural land-use categories (permanent grassland, fallow, cultivated grassland, permanent cultures, cereals, legumes, technical cultures, and vegetables) were based on the observed polygon median topsoil P content value if a particular soil–land use unit had sufficient number of sampling data in PANDA database to calculate the median value. The bagging model predicted topsoil P values were used in agricultural land where sampling data were limited or missing. The remaining three non-agricultural land-use types (forest, wetland, and peat extraction area) were based on the ordination model results.
Detailed description of data and methods is provided in: Kull, A.; Kikas, T.; Penu, P.; Kull, A., 2023. Modeling Topsoil Phosphorus — From Observation-Based Statistical Approach to Land-Use and Soil-Based High-Resolution Mapping. Agronomy, 12, x.
Modelleeriti mulla künnikihi taimedele omastatava fosfori (P) sisaldust (mg/kg). P modelleerimiseks kasutati PANDA andmebaasist pärit põllumajanduslikel maadel 2005-2020 mõõdetud mulla künnikihi P sisalduse andmeid. P mõõtmisi tehti ICP seadmega Melichi (M3) süsteemi järgi. Mulla P sisaldust seletavate tunnustena kasutati EstSoil-EH andmebaasis sisalduvaid mulla karakteristikuid, maakasutust (PRIA põllumassiividel kasvatavate kultuuride andmeid, lisaks EELIS andmebaasist looduslikke rohumaid (poollooduslikud kooslused) ja ETAKist metsi ja märgalasid. Seletavate tunnustena kasutati ka pinnakatte settetüüpe ning asukoha XY ja Z koordinaate (kõrgused pärinesid Maa-ameti 10 m lahutusvõimega LiDAR kõrgusmudelist). Ordinatsioonimeetodi puhul järjestati kõik esinevad mullad ja maakasutusklassid P sisalduse mediaanväärtuse alusel suuremast väiksemani ning interpoleeriti programmis Surfer (Radial Basis, Multiquadratic meetodiga) väärtuspind, mis iseloomustab P sisaldust erinevate mulla ja maakasutuse klasside kombinatsioonide korral ning annab pideva väljana väärtused ka mõõtmisandmetega katmata mulla ja maakasutusklasside kombinatsioonidele. Lisaks PANDA andmebaasist pärinevatele P andmetele kasutati ordinatsioonipinna loomisel ka teiste uuringute käigus mõõdetud ja kirjanduses avaldatud P mõõtmise tulemusi metsa ja märgalade muldade kohta. Saadud tulemused omistati mullakaardi ja maakasutuse kihi lõikamisel saadud mulla-maakasutuse polügonidele. Kirjeldava statistika andmed näitasid, et mulla ja maakasutuse mõju mulla P sisaldusel on oluline, aga kirjeldab ära ainult ligi 20% varieeruvusest. Suurema kirjeldusvõimega mudeli loomiseks kasutati masinõppe meetodit Bagging (Bootstrap Aggregation) statistikaprogrammis R ja paketti Baguette. Bagging mudelis kasutati seletavate tunnustena eelpool nimetatud EstSoil-EH mullakaardi andmeid, maakasutust, pinnakatte settetüüpe ja P mõõtmispunkti XYZ koordinaate. Bagging mudeli tulemuste täpsuse hindamiseks võrreldi omavahel bagging mudeli loomisest välja jäänud nn testandmetele (25% P mõõtmispunktidest) prognoositud P väärtusi samade punktide mõõdetud väärtustega ja saadi tulemuseks R2 = 0,54. Loodud bagging mudeli põhjal prognoositi P väärtused üle Eesti mulla-maakasutuse polügonidesse. Kuna mõõtmisi oli tehtud ainult põllumajanduslikel aladel, siis looduslikel aladel ei olnud mudeli tulemused piisavalt usaldusväärsed. Polügonides, kuhu jäi piisavalt määratud P väärtusi, asendati bagging mudeli prognoositud P väärtus polügoni tegeliku mõõdetud P mediaanväärtusega. Loodusliku maakasutusega aladel (mets, märgala) asendati bagging mudeli poolt prognoositud P väärtused ordinatsioonimudeli poolt prognoositud väärtustega, kuna ordinatsioonimudel sisaldas ka kirjandusest pärinevaid andmeid metsade ja märgalade P väärtuste kohta erinevatel mullatüüpidel.