이때까지 쿼리들은 boolean (document에 있다/없다만 판단)
- westlaw 같이 전문가들한테는 좋음
- 근데 일반인들한테는 별로 안좋음
Ranked retrieval
- rank를 매겨줌
- free text queries : 일반 사용자들은 보통 operator 사용하는것보다 하나 이상의 word를 검색함
- ranked : free text queries를 사용
Scoring
- searching하는 사람들에게 가장 유용할 것 처럼 보이는 순서대로 return
- 쿼리에 따라 각 document에 0~1사이의 값(score)를 할당
- 즉, ordering은 in query time에 수행. (real-time)
- 얼마나 document와 query가 match하는가를 정량화시켜야한다.
one-term query
- document에 query term이 한번도 안나타나면 score은 0
- document에 query term이 많이 나올수록 score은 높아져야함
방법1 : 자카드 계수(Jaccard coefficient)