대략 기획에만 2년 정도 걸렸고..
2005년엔 혼자서 1년동안 자바로 구현하다 지쳐서..
2006년, 2명이 더 붙어서 3명이 1년동안 만든 프로그램..
최종 이름은 거창하게 PIAS(Personalized Internet Agent System) 이다..
대략적인 프로그램의 구동은 이렇다.
1. 프로그램은 트레이아이콘의 형태로 24시간 사용자의 PC에서 작동된다.
사용자가 웹브라우저를 열어서 웹서핑을 하는 동안의 모든 Event를 Catch하여,
자체 개발한 알고리즘으로 사용자의 관심사를 추출한다.
즉, 사용자의 추상화된 정신 세계를 인터넷 행위를 감시하여 추상화 하고 PC에 동기화 시키는 것이다.
2. 동기화된 사용자 데이타(User Profile)을 기반으로,
프로그램에 내장된 Web Crawler가 사용자가 자주 방문하는 사이트를 중심으로 웹페이지를 수집, 분석한다.
데이타마이닝의 연관분석 및 자연어 처리에서 사용되는 유사도 분석, 문서 벡터 추출 등의 기법을 통하여,
사용자가 가장 관심을 가질 만한 문서를 추출한다.
즉, 사용자는 검색을 하지않고, 별도의 질의어의 입력없이, 필요할 것으로 예상되는 자료를 추천 받을 수 있다.
3. 문서의 추천을 위한 작업들은 많은 CPU사용과 DB IO를 필요로 하므로,
프로그램 자체적으로 스케쥴러를 내장,
사용자의 PC의 최대 유휴시간대를 추출, 해당작업을 수행하므로, 사용자는 PC 사용상 불편을 느끼지 않고 문서의 추천을 받을 수 있다.
예제 ) 밤새도록 문서의 수집, 분석을 거쳐 사용자는 아침에 일어났을때, 추천 문서를 신문 읽듯이 확인 할 수 있다
4. 에이전트는 사용자에게 비서와 같은 프로그램이므로,
시간과 장소에 구애받지 않고 서비스를 제공하고, 제공된 서비스에 대한 사용자의 반응(피드백)을 분석하여,
사용자 관심사 추출의 정확도를 높일 수 있다.
본 프로그램에서는 Cell phone 을 지원할 수 있는 서비스 서버를 내장하여, 사용자가 외부에서도 추천 문서를 읽는 다거나 할 수 있다. 또한 모바일 장치의 특성상, 웹페이지 자동요약, 해상도 변환등의 기능을 내장하였다.
5. 사용자의 관심사의 추출을 통해 개인화 검색 뿐만아니라,
관심사가 유사한 사용자간 친구추천과 유사한 기능을 구현하였다.
별도로 내장된 p2p 기반 메신저를 통하여 프로그램은 유사한 사용자(UDP, WS-Discovery)를 찾고,
사용자간 연결이 이루어지만 해당 사용자간 보유 자료를 공유할 수 있는 기능을 지원한다.
위에서 정의한 사용 시나리오외에도 많은 기능들이 있음..
아무튼 실제 구현물은 아래와 같음..
프로그램의 메인화면, 에이전트가 문서를 추천하고, 사용자는 필요한 웹문서를 스크랩하여 확인할 수 있다.
실시간 웹문서 문서변화 감지 기능을 내장하여, 웹페이상에 변화가 생겼을때, 사용자가 높은 관심을 가질 것이라고 생각되는 문구나 단어간 조합이 발생하였을때 에이전트가 즉시 통보해주는 기능, 바뀐부분을 Red Font로 변환하여 표시해 준다.
웹브라우저 실시간 감시기, 사용자의 모든 행위를 감시하고 DB에 동기화하며, 동기화된 데이터는 별도의 연산을 거쳐 사용자의 관심사 추출을 위한 데이터로 사용된다.
웹페이지 핵심영역 추출및 주제문장 추출, 자체 개발한 웹문서 필터링 방법을 적용 특정 문서에 주내용만 추출, 내용중에서 주제문장 만을 추출함.
사용자가 자주 방문하는 사이트를 추출, 새롭게 업로드 되는 Link만을 추출하여, 사용자의 관심도가 높을 것으로 생각되는 자료를 Sorting하여, 사용자가 특정사이트에 주기적인 방문없이도 한눈에 내용을 확인 할 수 있는 기능.
관심도가 유사한 사용자간 관련 자료를 공유 할 수 있음, Web 2.0 Tag 형식의 화면
원격지의 사용자가 추천 문서 확인이나 웹서핑을 할 수 있도록, 자체개발 해상도 및 의미기반 문서 최적화 기능을 사용, 해상도가 낮은 모바일 장비에서도 필요한 내용을 원활히 확인 할 수 있음.
상기의 이미지는 PIAS V3의 이미지임.
현재 Java 기반으로 V4 제작중..(회사다니면서 할려니 힘드네요.. -_-;)