파일검색 프로그램 Version 0.5
1.제작환경
- Windows xp professional SP 3
- Visual Studio.NET(2003) Dialog based MFC
- cLucene core 0.9.21
2. 목적
- 개인 컴퓨터 내 특정 폴더를 인덱싱한 후 지정한 검색어를 가지는 텍스트 파일 검색
3. 내용

<메인화면>
메인화면이 조금 조잡하긴 하지만,
그래도 초기버젼 보다는 많이 개선되었다.
그리고 초기버젼에 포함되었던 콘솔창이 오류를 야기하기 때문에
콘솔창은 없애버렸다.
콘솔창을 없앰으로써 프로그램이 조금은 깔끔해진 것 같다.
그래도 초기버젼 보다는 많이 개선되었다.
그리고 초기버젼에 포함되었던 콘솔창이 오류를 야기하기 때문에
콘솔창은 없애버렸다.
콘솔창을 없앰으로써 프로그램이 조금은 깔끔해진 것 같다.

현재 색인 생성은 되지만, 색인 업데이트는 제대로 되지 않는다.
폴더에 파일을 추가했을 경우에 색인을 새로 생성해야 하는
문제점이 있긴하지만,
아직 어떻게 업데이트를 해야 효율적으로 될지 잘 모르겠다.
폴더에 파일을 추가했을 경우에 색인을 새로 생성해야 하는
문제점이 있긴하지만,
아직 어떻게 업데이트를 해야 효율적으로 될지 잘 모르겠다.

<특정 폴더에 대한 색인 생성>
색인 생성 시 파일의 인코딩을 체크하고 모두 UTF-8 로 변환한 다음
Lucene에 입력할수 있도록 UTF-32로 다시 변환하는 과정을 거친다.
현재 영어, 한국어 뿐만 아니라
중국어, 일본어 에 대한 인코딩까지 감안해서 변환하게 되어있다.
iconv library를 사용해서 이렇게 쉽게 변환될 줄 알았다면,
미리 iconv 사용법을 공부해 놓을걸 하는 생각이....

Lucene에 입력할수 있도록 UTF-32로 다시 변환하는 과정을 거친다.
현재 영어, 한국어 뿐만 아니라
중국어, 일본어 에 대한 인코딩까지 감안해서 변환하게 되어있다.
iconv library를 사용해서 이렇게 쉽게 변환될 줄 알았다면,
미리 iconv 사용법을 공부해 놓을걸 하는 생각이....

<색인 한 폴더에 대해 검색>
색인한 폴더에 대해 검색어 입력을 통한 파일 검색을 한다.
검색한 파일 리스트를 선택하면 텍스트 파일 뷰어에서 열어볼수 있다.
텍스트 뷰어에서 입력한 검색어를 강조 해서 볼수 있다.
검색어 강조 부분을 개발하는데만 꼬박 이틀을 소요했다는....
그래도 가끔 버그가 발견 되네.
검색한 파일 리스트를 선택하면 텍스트 파일 뷰어에서 열어볼수 있다.
텍스트 뷰어에서 입력한 검색어를 강조 해서 볼수 있다.
검색어 강조 부분을 개발하는데만 꼬박 이틀을 소요했다는....
그래도 가끔 버그가 발견 되네.
또한,
cLucene에 기본적으로 포함되어 있는 StandardAnalyzer 로는
한글, 일본어, 중국어 색인과 검색이 제대로 되지 않기 때문에,
mix1009 님이 만든 CJK Analyzer를 사용했다.
(mix 1009 님 감사합니다. ^^)
출처: http://mix1009.net:82/category/%ED%94%84%EB%A1%9C%EA%B7%B8%EB%9E%98%EB%B0%8D?page=4
cLucene에 기본적으로 포함되어 있는 StandardAnalyzer 로는
한글, 일본어, 중국어 색인과 검색이 제대로 되지 않기 때문에,
mix1009 님이 만든 CJK Analyzer를 사용했다.
(mix 1009 님 감사합니다. ^^)
출처: http://mix1009.net:82/category/%ED%94%84%EB%A1%9C%EA%B7%B8%EB%9E%98%EB%B0%8D?page=4

<HTML Viewer>
검색된 파일이 HTML 파일일 경우 HTML 뷰어에 출력하게 했다.
그렇지만, HTML 뷰어에서 빈번하게 오류가 발견된다.
HTML 뷰어상에 검색어를 강조하기 위해 <font>와<b> 태그로
검색어를 Replace 하는데 검색어가 HTML 태그일 경우
문제가 발생하게 된다.
HTML 문서를 파싱해야 하는건가?
모르겠다. 어떻게 해야할지.......ㅜㅜ


중국어와 일본어 파일에 대한 검색 도 가능하다.
그렇지만, CJK Analyzer 또한 문자를 2개로 잘라서 색인하기 때문에
검색에 대한 효율은 그다지 높지않다.
현재로선 여기까지 검색되는 단계에서 만족해야 할듯하다.
4. 수정/보완해야 할 사항
- 로그파일 생성
- 색인 폴더 저장시 한글 폴더가 있는 경우 한글저장 안됨
- 색인 생성 시 Multi Thread를 사용해서 중간에 중지 시킬수 있도록 수정
- 색인 생성시 화면이 다시 그려지지 않는 것 수정
- HTML 화면 출력 시 제대로 출력되지 않는 오류빈도가 잦음.
- 로그파일 생성
- 색인 폴더 저장시 한글 폴더가 있는 경우 한글저장 안됨
- 색인 생성 시 Multi Thread를 사용해서 중간에 중지 시킬수 있도록 수정
- 색인 생성시 화면이 다시 그려지지 않는 것 수정
- HTML 화면 출력 시 제대로 출력되지 않는 오류빈도가 잦음.
첨부파일 : FileSearcher_V0.5.zip




덧글