Zbiór wzbogacono o oznaczenie konkretnych fragmentów zawierających odpowiedź na wskazane pytania.
Wszystkie wskazane fragmenty zostały zweryfikowane przez człowieka. Niektórym pytaniom przypisano wiele fragmentów.
Celem zbioru jest testowanie i rozwój systemów typu Question Answering dla języka polskiego.
Liczymy na to, że dzięki udostępnieniu zarówno pytań, jak i całej kolekcji testowej (całej Wikipedii z wybranego zrzutu), możliwe będzie przeprowadzenie różnych eksperymentów w tych samych warunkach, dzięki czemu wyniki będą ze sobą bezpośrednio porównywalne.
Zbiór udostępniany jest na licencji Creative Commons Uznanie Autorstwa, na tych samych warunkach 3.0 (CC-BY-SA 3.0).