Semantic of Semantics


syntactic : 문법의
semantic : 의미의, 의미론의
Pragmatics : 어용론(語用論)

Sematic Web이 10년만에 다시 활발하게 부활하고 있는 것 같습니다. 차세대 웹 2007에서도 KISTI, 솔투룩스, 시멘틱스 등의 회사를 초대해서 sematic web을 차세대 웹의 모양인듯 소개하고 있습니다. 시멘틱이라....

10년전쯤에 XML이 표준으로 제안되면서 여기저기 XML 전문회사들이 생겨나고 XML 에디터, XML 디파지토리, XML 검색엔진 등을 판매했던 적이 있습니다. XML은 단지 중간 표현적 언어였는데, 그것을 winner Language로 오판한 때문이 아니었나 싶습니다. 최근에는 쉽게들 XML을 사용하는 것 같습니다. 세계 표준적인 분야별 DTD가 보급될 것만 같았던 10년전의 분위기와 비교하여 10년이 지난 지금은 대충 DTD없도 XML을 잘 쓰고 있는 것 같습니다.

"컴퓨터가 의미를 이해한다는 것"에 대해서 다양한 이해가 있는 것 같습니다. 제가 보기에는 최근에 semantic을 접한 사람일 수록 sematic에 더 열광하고 있는 것 같고, 예전부터 semantic을 이해하던 사람들은 좀 생뚱맞게 상황을 바라보는 것 같습니다. 신념을 가진 사람들의 모습을 보면서 좀 걱정이 되는게 최근의 현실인 것 같습니다. 이러다가는 또 한번의 커다란 실망을 주게 되지 않을까, 실망 이후의 기근을 어찌 또 견뎌야 할지... 걱정입니다.

Semantic은 Syntactic에 대응하는 개념입니다. Syntactic은 과학적, 규칙적인 것을 대변해서 인공의 언어, 한정된 Tag를 가지는 word를 의미하고 주로 외형에 대해서 규정하는 범위를 가지는 것 같습니다. 반면에 Semantic은 Syntactic한데 받아들여질 수 없는 것에 대한 대책으로 나오게 된 것 같습니다. Semantic은 Real word를 반영하는 것으로 이해될 수 있겠지만, 컴퓨터로 Real word를 모델링 하는 것은 곧 커다란 artificial word에 지나지 않습니다. 그러니까 Sematic은 좀 더 섬세한 인공 세상 - 자연 세상을 많이 반영한 - 을 의미할 수 밖에 없습니다. "아버지가 자동차를 먹었다"와 같은 문장은 명사, 동사, 조사 등의 단위를 인식하는 syntactic word에서는 존재할 수 있는 문장이지만, "자동차는 음식이 아니다"라는 사실을 기록해둔 Sematic world에서는 존재하기 어려운 문장이 될 것입니다. (자동차 모양의 과자를 먹었다는 것이 사실이어도 의미론에서는 어쩔수가 없겠지요... 그것을 용납해주는 수준이 의미론입니다.) 그러므로 Syntactic과 Semantic은 다루는 단위의 범위의 차이가 있을 뿐 동일한 체계를 가지고 있습니다.

최근에 Semantic이 대세인듯 이야기하는 부류가 있지만 Semantic가 그다지 기존의 것과 많이 다르지 않다는 것을 이야기하려고 하지 않는 것 같습니다. Semantic이 완전 새로운 기술이라거나 개념이라고 주장하여야 새로운 제품과 값비싼 가격을 받을 수 있을 것 같지만, 실상 그 원리는 그다지 다르지 않은 것 같습니다.

Semamtic의 중요 개념은 word - (concept)과 (concept) - Relation - (concept) 입니다. 어떤 단어가 어떤 개념인지와 어느 개념과 어느 개념이 어떠한 관계를 가지고 있느냐를 이용하면 Semantic이 되는 것이고 단어의 아주 상위개념 - 특히 언어적인 관점에서 - 인 단어의 품사, 그리고 위치라는 Relation을 사용하면 일반적인 Syntactic이 되는 것 같습니다. 단지 대상과 관계의 종류가 많아진 다는 것이 다른 점이라고 하여야 할 것 같습니다. 그렇다면, Sematic을 도입하려면 어떠한 일을 하면 되는 것일까 생각해 보아야 겠습니다. 그것은 명확하게 대상으로 하는 concept들을 나누어 분류하고, Relation도 나누어 분류한 후에 concept과 concept간의 relation을 규정해 주는 것이 될 것 입니다. 이것을 어려운 이야기로 Ontology구축이라고도 하는 것 같습니다.

Ontology에 관해서는 최근에 이런저런 이야기가 많고 Sematic Web의 중심에 서 있는 것 같지만, 10년전 XML의 DTD마냥 그다지 보편화되기는 어려울 것으로 보입니다. 다른 이유도 많겠지만, 그것을 이해하고 응용할 수 있는 사람의 인건비가 너무 비싸서 선듯 구축하기가 어렵다는 것도 중요한 포인트가 아닐까 싶습니다. 온토로지보다 훨씬 단순한 구조의 서서러스도 아직 일반적인 버젼은 없습니다. 그러나 Ontology는 기업 내부의 니즈에 의해서 B2B 스타일로 구축될 가능성은 좀 있는 것 같습니다. 사내의 이런저런 단어의 표준화 즉 용어 표준화의 아주 중요한 도구로 - 표준 용어집 수준 - Ontology가 충분한 역할을 해줄수 있다고 보여지기 때문입니다. (우리 처럼 빨리빨리 문화에서는 약간 비관적이기도 합니다만...)


(하늘에 보이는 Cloud)



최근에, Sematic에 대해서는 Keyword와 대별되는 개념으로 Tag가 세워지고 있는 것 같습니다. 특히 검색엔진에서 이러한 시도들이 이미 진행되고 있는 것 같습니다. Keyword는 Document에서 단어를 뽑아서 [단어->문서]의 관계를 사용하는 수준을 의미합니다. 현재의 모든 검색엔진에 적용되어 있는 파라다임입니다. 반면에 Tag는 Document에서 단어를 뽑고 전체 corpus에서의 관점을 적용해서 [문서->Tag]의 관계를 사용하는 수준을 의미합니다. 최근에 나오고 있는 파라다임인 것 같습니다. 여기에 Semantic이라는 단어를 사용한 이유는 마케팅적인 관점에서, 예전과 다른 paradigm인 것을 표현하는 의지 정도로 이용되고 있지만, 적당한 용어인 것 같습니다. 어떤 Tag와 문서와의 관계를 명확하게 설명하기 곤란할때 Semantic이라는 단어를 들이대면 대충 넘어가 주지 않을까하는 생각이고, 실제로 현상이 좀 나름 semantic하다는 감성적인 측면이 있기도 하고 Contextual 혹은 Pragmatics 보다는 수준이 낮기 때문에 실상과 100% 맞지 않아도 면피성 위치에 Semantics가 위치하고 있기 때문입니다.



이 글과 관련있는 글을 자동검색한 결과입니다 [?]

by 하니가모 | 2007/11/07 09:55 | NLP | 트랙백(1) | 핑백(1) | 덧글(4)

트랙백 주소 : http://hanigamo.egloos.com/tb/1576787
☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]
Tracked from Andy님의 이글루 at 2007/11/08 21:12

제목 : concept 와 relation
지능의 단위는 concept 라는 거의 정설에서 출발하자. concept는 보통 지능의 단위, 지식의 단위, 그리고 인지의 단위라고 여겨진다. parsing의 궁극적 목적은 표현에 나타나는 구문적 어휘적 정보의 분석을 통하여 보통 proposition 라고 불리우는 의미단위를, 즉 문장의 concept를 추출하는 것이다. proposition,, 알고봄 열라&nbs......more

Linked at terra님의 글 - [200.. at 2007/11/08 10:05

... 0 metoo Semamtic의 중요 개념은 word - (concept)과 (concept) - Relation - (concept) 입니다. -- 華怡價帽가 하늘을 바라보며 오전 10시 5분 ... more

Commented by 째즈친구 at 2007/11/26 18:34
후배 영민입니다. (기억은 하실라나요? ㅎㅎ)
D사 갈까 해서 선배님 만나러 간게 마지막 만남이였던것 같네요. ㅎㅎ벌써 몇년전인가..
자문을 좀 얻으러 가야겠네요.. 검색과 semantic, ontology.. ^^
Commented by 하니가모 at 2007/11/26 20:48
놀러오세요. ^^
Commented by 김용수 at 2008/01/09 12:30
안녕하세요? 비비 김용수입니다.
오랜만에 와서 좋은 글을 보고 갑니다. 설명이 참 쉬우면서도 설득력 있습니다. 그건 조박사님처럼 털털한 인간성에서만 나올 수 있는 능력인가요? ㅎㅎ
웹2.0 세상이 온다고 많이 떠들 때, 저처럼 웹1.0으로 비즈니스를 하고 있는 사람으로서는, 허긴 기술을 만드는 사람이 아니라 장사하는 사람이라서 좀 입장이 다를 수는 있겠지만, 과연 저게 뭔데 저렇게들 난리인가 싶었던 적이 있습니다. 결국은 돈 줄 사람이 누군가가 중요할텐데 그에 대한 대책들이 있는 건가 싶었던 것이지요. 요즘 '웹2.0은 갔다'라는 기사 등을 접할 때 쓴 웃음이 좀 납니다요..
'면피성 위치에 semantics'가 위치... 참 재미있는 표현입니다.
Commented by 하니가모 at 2008/01/10 09:25

새해에도 하시는 모든일에서 성공하시기를 기원합니다.

:         :

:

비공개 덧글

◀ 이전 페이지          다음 페이지 ▶