본문 바로가기

명사 美 비격식 (무리 중에서) 아주 뛰어난[눈에 띄는] 사람[것]

이론

WodNet이란?: 단어들을 의미에 따라 분류하고 단어간의 관계를 체계적으로 정리한 '언어데이터베이스' Lexical Database

WodNet

넓은 의미에서는 데이터셋, 일반적인 AI 학습용 데이터셋과는 다르다. 

영어단어들을 의미에 따라 분류하고 단어간의 관계를 체계적으로 정리한 '언어데이터베이스' Lexical Database.

단어집합(synset) 간에 가장 빈번하게 인코딩되는 관계는 상위-하위 관계(super-subordinate relation, ISA 관계)

AI 분야에서는 WordNet을 언어데이터셋, 지식 데이터셋으로 취급한다. 

https://wordnet.princeton.edu/

 

WordNet

Any opinions, findings, and conclusions or recommendations expressed in this material are those of the creators of WordNet and do not necessarily reflect the views of any funding agency or Princeton University.What is WordNet?Current Status of the WordNet

wordnet.princeton.edu

 

 

 

잠시 홈페이지에 들어가 더 알아보자.

 

WordNet®은 방대한 영어 어휘 데이터베이스입니다.

명사, 동사, 형용사, 부사는 각각 고유한 개념을 표현하는 인지적 동의어 집합(synset)으로 그룹화됩니다.

WordNet은 단어의 의미를 기준으로 단어를 그룹화한다는 점에서 표면적으로는 유의어 사전과 유사합니다.

그러나 몇 가지 중요한 차이점이 있습니다.

 

첫째, WordNet은 단순히 단어 형태(문자열)뿐만 아니라 단어의 특정 의미까지 연결합니다.

결과적으로 네트워크에서 서로 가까이 위치한 단어들은 의미적으로 모호성이 해소됩니다.

둘째, WordNet은 단어 간의 의미적 관계를 명시적으로 나타내는 반면,

유의어 사전의 단어 그룹화는 의미 유사성 외에는 명확한 패턴을 따르지 않습니다.

 

 

WordNet의 대부분의 관계는 같은 품사(POS)의 단어들을 연결합니다. 
따라서 WordNet은 명사, 동사, 형용사, 부사 각각에 대한 네 개의 하위 네트워크로 구성되며, 품사 간 연결은 거의 없습니다. 품사 간 관계에는 의미적으로 유사하고 같은 어간을 공유하며 
같은 의미를 갖는 단어들 사이의 형태의미적 연결이 포함됩니다. 
예를 들어 observe(동사), observant(형용사), observation, observatory(명사) 등이 있습니다. 
많은 명사-동사 쌍에서 명사의 동사에 대한 의미 역할이 명시되어 있습니다. 
{sleeper, sleeping_car}는 {sleep}의 위치(LOCATION)이고, 
{painter}는 {paint}의 행위자(AGENT)이며, {painting, picture}는 결과(RESULT)입니다.

 

 

 

즉 단순히 단어목록을 저장하는 것이 아니라 상위개념과 하위개념관계를 이용해 의미적 계층 구조를 구성한다.

Entity (개체)
 └─ Physical Object (물리적 객체)
     └─ Living Thing (생물체)
         └─ Organism (생물)
             ├─ Animal (동물)
             │   ├─ Mammal (포유류)
             │   │   ├─ Dog (개)
             │   │   └─ Cat (고양이)
             │   └─ Bird (새)
             └─ Plant (식물)
                 ├─ Tree (나무)
                 └─ Flower (꽃)