IBM Content Analytics, 버전 2.2 이상
용어집
이 용어집에는 IBM® Content Analytics 제품 인터페이스 및 문서에서 사용된 용어에 대해 정의되어 있습니다.
- 가중치 용어 검색(weighted term search)
- 특정 용어에 더 많은 중요성을 지정하는 쿼리입니다.
- 가타카나(Katakana)
- 2개의 일반적인 일본어 음성 알파벳 중 하나에서 사용되는 기호로 구성된 문자 세트입니다. 주로 외국어를 음성학적으로 쓸 때 사용됩니다.
- 개념 추출(concept extraction)
- 텍스트 문서에서 중요한 어휘 항목(예: 사람, 장소 또는 제품)을 식별하고 해당 항목 목록을 생성하는 텍스트 분석 기능입니다. 테마 추출(theme extraction)을 참조하십시오.
- 개행 문자(newline character)
- 인쇄 또는 표시 위치를 한 행 아래로 이동하는 제어 문자입니다.
- 검색 결과(search results)
- 검색 요청과 일치하는 문서 목록입니다.
- 검색 기능(discoverer)
- 크롤러가 정보를 검색하는 데 사용할 수 있는 데이터 소스를 결정하는 크롤러의 기능입니다.
- 검색 엔진 배제 표준(Robots Exclusion Protocol)
- 웹 사이트 관리자가 방문한 검색 엔진에게 방문해서는 안되는 사이트 일부를 표시할 수 있게 해주는 프로토콜입니다.
- 검색 엔진(search engine)
- 검색 요청을 수락하고 문서 목록을 사용자에게 리턴하는 프로그램입니다.
- 검색 엔진에서 제외되는 단어 제거(stop word removal)
- 일반적인 단어를 무시하고 더 관련성이 있는 결과를 리턴하기 위해 쿼리에서 검색 엔진에서 제외되는 단어를 제거하는 프로세스입니다.
- 검색 엔진에서 제외되는 단어(stop word)
- 검색 응용프로그램에서 무시하는, 일반적으로 사용되는 단어입니다(예: the, an 또는 and)입니다.
- 검색 응용프로그램(search application)
- 쿼리를 처리하고, 인덱스를 검색하며, 검색 결과를 리턴하고, 소스 문서를 검색하는 프로그램입니다.
- 검색 인덱스 파일(search index files)
- 검색 엔진에 인덱스가 저장된 파일 세트입니다.
- 검색 캐시(search cache)
- 이전 검색 요청의 데이터와 결과를 보관하는 버퍼입니다.
- 관리 역할(administrative role)
- 사용자에 대한 액세스 권한을 규정하는 사용자 분류입니다.
- 구문 분석기 드라이버(parser driver)
- 문서에 구문 분석기 서비스를 제공하는 서비스입니다. 콜렉션마다 하나의 구문 분석기 드라이버가 있습니다. 콜렉션의 구문 분석기 드라이버 서비스는 관리 콘솔의 콜렉션 구문 분석기에 해당합니다.
- 구문 분석기 서비스(parser service)
- 문서 콜렉션의 모든 문서 구문 분석 및 텍스트 분석 처리를 다루는 서비스입니다. 항상 하나 이상의 구문 분석기 서비스가 실행되고 있습니다.
- 구문 분석기(parser)
- 데이터 저장소에 추가할 문서를 해석하는 프로그램입니다. 구문 분석기는 문서에서 정보를 추출하여 인덱싱 및 검색할 수 있도록 준비합니다.
- 구분 발음 부호(diacritic)
- 문자 또는 문자 조합의 음성 값 변화를 나타내는 표시입니다.
- 규칙 기반 범주(rule-based category)
- 어떤 문서를 어떤 범주와 연관시킬지 지정하는 규칙에서 작성한 범주입니다. 예를 들어, 특정 단어를 포함 또는 제외하거나, URI(Uniform Resource Identifier) 패턴이 일치하는 문서를 특정 범주와 연관시키는 규칙을 정의할 수 있습니다.
- 근접 검색(proximity search)
- 서로 일정한 범위 내(예: 동일한 구문 또는 단락)에 둘 이상의 일치하는 용어가 발생할 경우 결과를 리턴하는 텍스트 검색입니다.
- 기능 경로(feature path)
- UIMA(Unstructured Information Management Architecture) 기능 구조에서 기능 값을 액세스하는 데 사용되는 경로입니다.
- 기능 구조(feature structure)
- 텍스트 분석의 결과를 나타내는 기본 데이터 구조입니다. 기능 구조는 속성-값 구조입니다. 모든 기능 구조는 유형으로 되어 있고, 각 유형에는 Java 클래스 같은 유효한 기능 또는 속성의 지정된 세트가 있습니다.
- 기본 어노테이터(base annotator)
- 기본 문서 분석 처리에 사용된 표준 텍스트 분석 엔진 세트입니다.
- 단어 어간(word stemming)
- 단어의 변형 형식이 공통 형식으로 축소되는 언어 정규화 과정입니다. 예를 들어, connections, connective 및 connected는 connect로 축소됩니다.
- 데이터 소스 유형(data source type)
- 데이터에 액세스하기 위해 사용한 프로토콜에 따라 데이터 소스를 그룹화한 것입니다.
- 데이터 소스(data source)
- 문서를 검색할 수 있는 데이터 저장소(예: 웹, 관계형/비관계형 데이터베이스 및 컨텐츠 관리 시스템)입니다.
- 데이터 저장소(data store)
- 구문 분석한 양식으로 문서를 보관하는 데이터 구조입니다.
- 동의어 사전(synonym dictionary)
- 사용자가 콜렉션을 검색할 때 쿼리 용어의 동의어를 검색할 수 있게 해주는 사전입니다.
- 동적 순위(dynamic ranking)
- 검색할 문서와 관련하여 쿼리의 용어를 분석하여 결과 순위를 결정하는 순위 지정 유형입니다. 텍스트 기반 점수(text-based scoring)를 참조하십시오. 정적 순위(static ranking)와 반대입니다.
- 동적 요약(dynamic summarization)
- 검색 용어를 강조 표시하고 검색 결과에 사용자가 검색하고 있는 문서의 개념을 가장 잘 나타내는 구문이 포함되는 요약 유형입니다. 정적 요약(static summarization)과 반대입니다.
- 라이브러리(library)
- 다른 오브젝트에 대해 디렉토리 역할을 하는 시스템 오브젝트입니다. Domino Document Manager 라이브러리(Domino Document Manager library)를 참조하십시오.
- 로컬 페더레이터(local federator)
- 사용자가 이종 콜렉션 세트를 검색할 수 있고 통합된 검색 결과 세트를 얻을 수 있게 해주는 검색 및 인덱스 API에서 만든 클라이언트 오브젝트입니다.
- 리모트 페더레이터(remote federator)
- 검색 가능한 오브젝트 세트를 연합하는 서버 페더레이터입니다.
- 링크 분석(link analysis)
- 문서 간의 하이퍼링크 분석을 기반으로 하고 사용자에게 중요한 콜렉션의 페이지를 판별하는 데 사용되는 방법입니다.
- 마스킹 문자(masking character)
- 검색 용어의 앞, 중간 및 끝에서 옵션 문자를 나타내는 데 사용되는 문자입니다. 일반적으로 인덱스에서 용어의 변형을 찾는 데 마스킹 문자가 사용됩니다. 와일드 카드 문자(wildcard character)를 참조하십시오.
- 마스터 관리자(master administrator)
- 사용자가 전체 IBM Content Analytics 시스템을 관리할 수 있게 해주는 관리 역할입니다.
- 매개변수식 검색(parametric search)
- 날짜, 정수 또는 지정된 범위 내의 다른 숫자 데이터 유형 같은 숫자 값이나 속성이 포함된 오브젝트를 찾는 검색 유형입니다.
- 모니터(monitor)
- 콜렉션 레벨의 프로세스를 관찰할 수 있는 권한이 있는 사용자입니다.
- 무형식 텍스트(free-form text)
- 단어 또는 구문으로 구성된 구조화되지 않은 텍스트입니다.
- 문서 오브젝트 모델(Document Object Model)
- 구조화된 문서(예: XML 파일)를 프로그래밍 방식으로 액세스 및 갱신할 수 있는 오브젝트 트리로 표시하는 시스템입니다.
- 문자 정규화(character normalization)
- 대문자 표시 및 구분 발음 부호 같은 문자의 변형 양식을 일반 양식으로 축소하는 프로세스입니다.
- 범주 트리(category tree)
- 범주의 계층 구조입니다.
- 보안 토큰(security token)
- 콜렉션의 문서에 대한 액세스를 승인하기 위해 사용된 ID 및 보안에 대한 정보입니다. 데이터 소스 유형마다 다른 유형의 보안 토큰을 지원합니다. 컨텐츠에 대한 액세스를 제어하기 위해 사용할 수 있는 사용자 역할, 사용자 ID, 그룹 ID 및 기타 정보가 여기에 포함됩니다.
- 부스트 단어(boost word)
- 검색 결과에서 문서의 상대적인 순위에 영향을 미칠 수 있는 단어입니다. 쿼리 처리 중에 부스트 단어가 포함된 문서의 중요성은 단어에 대해 사전 정의된 스코어에 따라 높아지거나 낮아질 수 있습니다.
- 부스트 클래스(boost class)
- 검색 결과에서 문서의 상대적인 순위에 영향을 미칠 수 있는 스펙이 포함된 오브젝트입니다.
- 부울 검색(Boolean search)
- AND, NOT 및 OR 같은 연산자를 사용하여 하나 이상의 검색 용어를 결합한 검색입니다.
- 분류(taxonomy)
- 유사성에 따라 오브젝트를 그룹으로 분류합니다. 분류를 통해 데이터가 범주 및 하위 범주로 구성됩니다. 범주 트리(category tree)를 참조하십시오.
- 분석 결과(analysis results)
- 어노테이터에서 생성한 정보입니다. 분석 결과는 일반 분석 구조라고 하는 데이터 구조에 기록됩니다. 사용자 정의 텍스트 분석 엔진(어노테이터)에서 생성한 분석 결과를 인덱스에 포함하여 분석에 사용할 수 있습니다.
- 분석 방식(segmentation)
- 텍스트를 명확한 어휘 단위로 구분하는 것입니다. 비사전 기반 처리에는 공백 및 n-gram 음절 분석이 포함되는 반면, 사전 기반 지원에는 단어, 구문 및 단락 분석 방식과 표제어 정리(lemmatization)가 포함됩니다.
- 분석 엔진(analysis engine)
- 텍스트 분석 엔진(text analysis engine)을 참조하십시오.
- 불분명 용어(opaque term)
- 언어 쿼리 구문 분석기에서 구문 분석하지 않는 쿼리 용어입니다. 대신 불분명 용어는 구현마다 다른 구문에 의해 식별됩니다. 예를 들어, XML 쿼리 언어가 포함된 XML 문서를 검색하기 위한 구문에 의해 식별됩니다. 불분명 용어는 @ 문자 및 쿼리 언어 ID로 시작됩니다. 예를 들어, @xmlf2는 쿼리를 XML 조각 쿼리 언어에서 처리하도록 지정하고, @xmlp는 쿼리를 XPath 쿼리 언어에서 처리하도록 지정합니다.
- 빠른 링크(quick link)
- URI(Uniform Resource Identifier) 및 키워드 또는 구문 간의 연관입니다.
- 사용자 에이전트(user agent)
- 웹을 찾아보고 방문한 사이트에 자신의 정보를 남기는 응용프로그램입니다. 예를 들어, 웹 크롤러는 사용자 에이전트입니다.
- 사용자 정의 텍스트 분석 엔진(custom text analysis engine)
- UIMA(Unstructured Information Management Architecture) 소프트웨어 개발 킷(SDK)을 사용하여 작성하고 표준 텍스트 분석 엔진 세트(기본 어노테이터라고도 함)에 추가할 수 있는 텍스트 분석 엔진입니다. 텍스트 분석 엔진(text analysis engine)을 참조하십시오.
- 서블릿(servlet)
- 웹 서버에서 실행되고 웹 클라이언트 요청에 대한 응답으로 동적 컨텐츠를 생성함으로써 서버의 기능을 확장하는 Java 프로그램입니다. 일반적으로 데이터베이스를 웹에 연결하는 데 서블릿이 사용됩니다.
- 소프트 오류 페이지(soft error page)
- 요청한 웹 페이지를 리턴할 수 없는 이유에 대한 정보를 제공하는 웹 페이지 유형입니다. 예를 들어, 단순한 상태 코드를 리턴하는 대신 HTTP 서버는 상태 코드를 자세히 설명하는 페이지를 리턴할 수 있습니다.
- 순위(ranking)
- 쿼리 검색 결과의 각 문서에 정수 값을 지정한 것입니다. 검색 결과의 문서 순위는 쿼리와의 관련성을 기반으로 합니다. 순위가 높을수록 더 가깝게 일치함을 의미합니다. 동적 순위(dynamic ranking) 및 정적 순위(static ranking)를 참조하십시오.
- 시드 목록 페이지(seed list page)
- WebSphere Portal에서 사용 가능한 페이지에 대한 링크가 포함된 XML 페이지입니다. 크롤러는 시드 목록을 사용하여 검색할 문서를 식별합니다. 시드 목록 페이지에는 검색한 문서와 함께 인덱스에 저장되는 메타데이터가 포함되어 있습니다.
- 시작 URL(Uniform Resource Locator)
- 검색의 시작점입니다.
- 식별 이름(distinguished name)
- 디렉토리의 항목을 고유하게 식별하는 이름입니다. 식별 이름은 쉼표로 구분된 속성:값 쌍으로 구성되어 있습니다. 또한 디지털 인증서의 엔티티를 고유하게 식별하는 이름-값 쌍 세트(예: CN=개인 이름 및 C=국가 또는 지역)입니다.
- 액세스 제어 목록(ACL, access control list)
- 컴퓨터 보안에서 오브젝트에 액세스할 수 있는 모든 주제와 주제의 액세스 권한을 식별하는 오브젝트와 연관된 목록입니다.
- 어간(stemming)
- 단어 어간(word stemming)을 참조하십시오.
- 어노테이션(annotation)
- 텍스트 범위에 대한 정보입니다. 예를 들어, 텍스트 범위가 회사 이름을 나타내도록 어노테이션에서 표시할 수 있습니다. UIMA(Unstructured Information Management Architecture)에서 어노테이션은 특별한 종류의 기능 구조입니다.
- 어노테이터(annotator)
- 특정한 언어 분석 작업을 수행하고 어노테이션을 생성 및 기록하는 소프트웨어 구성요소입니다. 어노테이터는 분석 엔진의 분석 논리 구성요소입니다.
- 어휘 친화도(lexical affinity)
- 의미에 있어서 서로 긴밀한 문서의 검색 단어 관계입니다. 어휘 친화도를 사용하여 결과의 관련성을 측정합니다.
- 언어 검색(linguistic search)
- 기본 형식으로 축소되거나(예를 들어, mice는 mouse로 인덱스화됨) 기본 형식과 함께 확장되는(복합어의 경우) 용어가 포함된 문서를 찾아보고, 검색 및 인덱스화하는 검색 유형입니다.
- 언어 식별(language identification)
- 문서의 언어를 판별하는 검색 기능입니다.
- 연결 문자 출력(ligature)
- 하나의 문자로 표시되도록 연결된 둘 이상의 문자입니다. 예를 들어, ff 및 ffi는 연결 문자 출력으로 표시할 수 있는 문자입니다.
- 영역(room)
- 사용자가 다른 사용자가 읽을 수 있는 문서를 작성하고, 다른 사용자의 주석에 대응하고, 프로젝트 상태 및 데드라인을 검토할 수 있게 해주는 프로그램입니다. 사용자는 같은 영역에 있는 다른 사용자와 대화할 수도 있습니다. Lotus QuickPlace 영역(Lotus QuickPlace room)을 참조하십시오.
- 와일드 카드 문자(wildcard character)
- 검색 용어의 앞, 중간 또는 끝에서 옵션 문자를 나타내는 데 사용되는 문자입니다.
- 요약(summarization)
- 문서의 컨텐츠를 간략하게 설명하기 위해 검색 결과에 중복되지 않는 구문을 포함하는 과정입니다. 동적 요약(dynamic summarization) 및 정적 요약(static summarization)을 참조하십시오.
- 운영자(operator)
- 콜렉션 레벨의 프로세스를 관찰, 시작 및 중지할 수 있는 권한이 있는 사용자입니다.
- 원시 데이터 저장소(raw data store)
- 검색한 문서를 구문 분석기로 보내기 전에 저장하는 데이터 구조입니다. 크롤러가 원시 데이터 저장소에 쓰고, 구문 분석기가 원시 데이터 저장소에서 읽습니다. 문서를 구문 분석한 경우 원시 데이터 저장소에서 제거됩니다. 데이터 저장소와 혼동하지 마십시오.
- 웹 크롤러(Web crawler)
- 웹 문서를 검색하고 문서 내의 링크에 따라 웹을 탐색하는 크롤러 유형입니다.
- 유니코드 기반 공백 문자 분석 방식(Unicode-based white space segmentation)
- 유니코드 문자 등록 정보를 사용하여 토큰 및 구분자 문자를 구별하는 토큰화 방법입니다.
- 유형 시스템(type system)
- 유형 시스템은 문서에서 텍스트 분석 엔진이 발견할 수 있는 오브젝트 유형(기능 구조)을 정의합니다. 유형 시스템은 유형 및 기능 면에서 모든 가능한 기능 구조를 정의합니다. 유형 시스템에서 얼마든지 다른 유형을 정의할 수 있습니다. 유형 시스템은 도메인과 응용프로그램에 따라 다릅니다.
- 의미 검색(semantic search)
- 언어 분석과 문맥 분석을 통합한 키워드 검색 유형입니다. 텍스트 분석(text analysis)을 참조하십시오.
- 이용 빈도 순위(popular ranking)
- 문서의 이용 빈도 순위에 따라 문서의 기존 순위를 높이는 순위 유형입니다.
- 인덱스 캐시(index cache)
- 문서를 다시 크롤링하지 않고도 인덱스를 재빌드할 수 있도록 데이터를 보관하고 있는 버퍼입니다.
- 인덱스 큐(index queue)
- 기본 및 델타 인덱스 빌드를 처리하기 위한 요청 목록입니다.
- 인덱스(index)
- 전체 텍스트 인덱스(full-text index)를 참조하십시오.
- 인증 기관(certificate authority)
- 디지털 서명 및 공개-개인 키 쌍을 작성하는 데 필요한 디지털 인증서를 발행하는 트러스트된 써드 파티 조직 또는 회사입니다. 인증 기관은 고유한 인증서를 부여받은 개인의 ID를 보증합니다.
- 인증서(certificate)
- 컴퓨터 보안에서 공개 키를 인증서 소유자의 ID에 결합함으로써 인증서 소유자를 인증할 수 있게 해주는 디지털 문서입니다. 인증서는 인증 기관에서 발행하고 해당 권한으로 디지털 서명되어 있습니다.
- 일반 분석 구조 이용자(CAS 이용자, common analysis structure consumer)
- 일반 분석 구조에 저장된 분석 결과에 대해 최종 처리를 수행하는 이용자입니다. 예를 들어, 이용자가 검색 엔진에서 일반 분석 구조의 컨텐츠를 인덱스화하거나 관계형 데이터베이스를 특정 분석 결과로 채웁니다.
- 일반 분석 구조(CAS, common analysis structure)
- 문서의 컨텐츠 및 메타데이터와 텍스트 분석 엔진에서 생성한 모든 분석 결과를 저장하는 구조입니다. 문서 분석 중의 모든 데이터 교환은 일반 분석 구조를 사용하여 처리합니다.
- 일반 통신 계층(CCL, common communication layer)
- IBM Content Analytics의 다양한 구성요소(제어기, 구문 분석기, 크롤러, 인덱스 서버)를 통합하는 통신 인프라입니다.
- 작업공간(place)
- 개인 및 그룹이 만나 협업하는 포털에 표시되는 가상 위치입니다. 포털에서 모든 사용자는 개인 작업을 위한 개인 작업공간을 갖고 있고, 개인 및 그룹은 공용 작업공간 또는 제한된 작업공간일 수 있는 다양한 공유 작업공간에 액세스할 수 있습니다. Lotus QuickPlace 작업공간(Lotus QuickPlace place)을 참조하십시오.
- 전체 텍스트 인덱스(full-text index)
- 검색에서 쿼리 용어를 포함하는 문서를 찾을 수 있도록 데이터 항목을 참조하는 데이터 구조입니다.
- 접어(clitic)
- 구문적으로는 별개로 작동하지만 음성학적으로 다른 단어에 연결되어 있는 단어입니다. 접어는 연결된 단어와 별개로 또는 연결하여 쓸 수 있습니다. 접어의 일반적인 예로는 영어의 축소형 마지막 부분(예: wouldn't 또는 you're)이 있습니다.
- 정규식 어노테이터(regular expression annotator)
- 문서 텍스트에서 검색한 정확한 패턴을 설명하는 정규식을 기반으로 텍스트 문서에서 정보의 엔티티 또는 단위(예: 제품 번호)를 검색하는 소프트웨어 구성요소입니다. 정규식 하나가 문서 텍스트의 일부와 일치할 경우 정규식 어노테이터가 일치부분 또는 일부분에 해당하는 어노테이션을 작성합니다. 그런 다음 어노테이션을 작성한 표현식이 인덱스 맵핑 파일을 사용하여 인덱스에 저장되거나 데이터베이스 맵핑 파일을 사용하여 JDBC 가능 데이터베이스에 저장됩니다.
- 정보 추출(information extraction)
- 중요한 어휘 항목(예: 이름, 용어 및 표현식)을 텍스트 문서에서 자동으로 인식하는 개념 추출 유형입니다.
- 정적 순위(static ranking)
- 순위가 지정되는 문서의 요소(예: 날짜, 문서를 가리키는 링크 수 등)로 인해 문서의 순위가 증가되는 순위 지정 유형입니다. 동적 순위(dynamic ranking)와 반대입니다.
- 정적 요약(static summarization)
- 검색 결과에 문서에서 지정된 저장 요약이 포함되는 요약 유형입니다. 동적 요약(dynamic summarization)과 반대입니다.
- 조각(shingle)
- 구문에서 가져온 연속 토큰 문자열(단어)입니다.
예를 들어, "This is a very short sentence."에서 3 단어 조각(또는 삼자명)은 다음과 같습니다.
This is a
is a very
a very short
very short sentence통계 언어에 이 조각을 사용할 수 있습니다. 예를 들어, 2개의 다른 텍스트에 많은 공통 조각이 있는 경우 텍스트가 어느 정도 관련되어 있을 수 있습니다.
- 증명서(credential)
- 사용자, 그룹 연관 및 다른 보안 관련 ID 속성을 설명하는 자세한 정보로 인증 중에 취득합니다. 증명서를 사용하여 권한 부여, 감사 및 위임 같은 여러 서비스를 수행할 수 있습니다. 예를 들어, 사용자의 로그온 정보(사용자 ID 및 암호)는 사용자가 어카운트에 액세스할 수 있게 허용하는 증명서입니다.
- 처리 엔진 아카이브(processing engine archive)
- UIMA(Unstructured Information Management Architecture) 분석 엔진과 사용자 정의 분석을 위해 이를 사용하는 데 필요한 모든 자원이 포함된 .pear zip 아카이브 파일입니다.
- 콜렉션(collection)
- 데이터 소스를 크롤링, 구문 분석, 인덱싱 및 검색하기 위한 옵션 및 데이터 소스 세트입니다.
- 큐에 넣기(enqueue)
- 메시지 또는 항목을 큐에 넣습니다.
- 큐에서 방출(dequeue)
- 큐에서 항목을 제거합니다.
- 크롤러(crawler)
- 데이터 소스에서 문서를 검색하고 검색 인덱스를 작성하기 위해 사용할 수 있는 정보를 수집하는 소프트웨어 프로그램입니다.
- 크롤링 스페이스(crawl space)
- 크롤러가 인덱스화할 항목을 검색하기 위해 읽는 지정된 패턴(URL(Uniform Resource Locator), 데이터베이스 이름, 파일 시스템 경로, 도메인 이름 및 IP 주소)을 비교하는 소스 세트입니다.
- 키 데이터베이스 파일(key database file)
- 키 링을 참조하십시오. 키 링(key ring)으로 이동하는 링크입니다.
- 키 링(key ring)
- 컴퓨터 보안에서 공개 키, 개인 키, 트러스트된 루트 및 인증서가 포함된 파일입니다. 키스토어 파일(keystore file)을 참조하십시오.
- 키스토어 파일(keystore file)
- 서명자 인증서로 저장된 공개 키와 개인 인증서에 저장된 개인 키가 모두 포함된 키 링입니다.
- 테마 추출(theme extraction)
- 문서의 테마 또는 주제를 추출하기 위해 텍스트 문서에서 중요한 어휘 항목을 자동으로 인식하는 개념 추출 유형입니다. 개념 추출(concept extraction)을 참조하십시오.
- 텍스트 기반 점수(text-based scoring)
- 쿼리의 용어와 관련하여 문서의 연관성을 표시하는 정수 값을 문서에 지정하는 과정입니다. 정수 값이 높을수록 쿼리와 더 가깝게 일치함을 의미합니다. 동적 순위(dynamic ranking)를 참조하십시오.
- 텍스트 분석 방식(text segmentation)
- 분석 방식(segmentation)을 참조하십시오.
- 텍스트 분석 엔진(text analysis engine)
- 텍스트에서 컨텍스트 및 의미 컨텐츠를 찾거나 표시하는 소프트웨어 구성요소입니다.
- 텍스트 분석(text analysis)
- 콜렉션에서 데이터 검색 가능성을 개선하기 위해 텍스트에서 의미와 다른 정보를 추출하는 과정입니다. 의미 검색(semantic search)을 참조하십시오.
- 토큰(token)
- 인덱스화되는 기본 텍스트 단위입니다. 토큰은 언어의 단어 또는 인덱싱에 적절한 다른 텍스트 단위일 수 있습니다.
- 토큰화 프로그램(tokenizer)
- 텍스트를 검색하고 일련의 문자를 토큰으로 인식할 수 있는지 여부와 시점을 판별하는 텍스트 분석 방식 프로그램입니다.
- 토큰화(tokenization)
- 입력을 토큰으로 구문 분석하는 과정입니다.
- 트레일링 문자(trailing character)
- 단어의 마지막 위치를 차지하는 문자입니다.
- 패싯(facet)
- 명확하게 정의된 주제의 등록 정보입니다. 지정한 주제의 패싯은 상호 배타적이고 통합적으로 포괄적입니다. 패싯된 분류 스킴은 하나 이상의 패싯을 사용하여 해당 항목을 찾을 수 있는 계층 구조적 범주 스킴과 다릅니다.
- 패싯된 검색(faceted browsing)
- 사전 정의된 패싯 콜렉션인 패싯된 분류 시스템의 유효한 값 중에서만 순차적으로 선택하여 항목 세트를 필터링함으로써 정보를 검색하는 프로세스입니다.
- 퍼지 검색(fuzzy search)
- 검색 용어의 철자와 유사한 철자를 가진 단어를 리턴하는 검색입니다.
- 페더레이션(federation)
- 집계 시스템이 이름 지정 시스템에서 복합 이름을 처리할 수 있도록 이름 지정 시스템을 결합하는 프로세스입니다.
- 페더레이티드 검색(federated search)
- 여러 검색 서비스에서 검색을 가능하게 하고 검색 결과의 통합된 목록을 리턴하는 검색 기능입니다.
- 표제어 정리(lemmatization)
- 텍스트에 있는 각 단어 형식의 표제어를 판별하는 프로세스입니다. 단어의 표제어에는 단어의 기본 형식과 동일한 품사를 공유하는 어미 변화 형식이 포함되어 있습니다. 예를 들어, go의 표제어에는 go, goes, went, gone 및 going이 포함됩니다. 명사의 표제어에는 단수 및 복수 형식(예: calf 및 calves)이 포함됩니다. 형용사의 표제어에는 비교급 및 최상급 형식(예: good, better 및 best)이 포함됩니다. 대명사의 표제어에는 동일한 대명사의 다른 문법적 격이 포함됩니다(예: I, me, my 및 mine).
- 표제어(lemma)
- 단어의 기본 형식과 동일한 품사를 공유하는 어미 변화 형식이 결합된 것입니다.
- 프록시 서버(proxy server)
- 응용프로그램이나 웹 서버에서 호스트하는 HTTP 웹 요청의 매개 역할을 하는 서버입니다. 프록시 서버는 엔터프라이즈의 컨텐츠 서버에 대한 대리 역할을 합니다.
- 프리 텍스트 검색(free text search)
- 검색 용어가 무형식 텍스트로 표시되는 검색입니다.
- 필드(field)
- 특정 범주의 데이터 또는 제어 정보가 입력되는 영역입니다.
- 필드별 검색(fielded search)
- 특정 필드로 제한된 쿼리입니다.
- 혼합 검색(hybrid search)
- 부울 검색과 프리 텍스트 검색이 결합된 검색입니다.
- DIIOP(Domino Internet Inter-ORB Protocol)
- 서버에서 실행되고 Domino Object Request Broker와 같이 사용하여 Notes® Java 클래스 및 Domino 서버와 함께 작성된 Java™ 애플릿 간의 통신을 허용하는 서버 태스크입니다. 브라우저 사용자 및 Domino 서버는 DIIOP를 사용하여 통신하고 오브젝트 데이터를 교환합니다.
- Domino Document Manager 라이브러리(Domino Document Manager library)
- Domino Document Manager에 대한 시작점인 Domino Document Manager 데이터베이스입니다.
- Domino® Document Manager 캐비닛(Domino Document Manager cabinet)
- 문서를 구성하기 위해 사용하는 Domino Document Manager 데이터베이스입니다. 캐비닛에는 Domino 데이터베이스가 보관됩니다.
- Escape 문자(escape character)
- 뒤에 오는 하나 이상의 문자에 대해 특별한 의미를 제외하거나 선택하는 문자입니다.
- ID 관리(identity management)
- 사용자가 콜렉션의 각 저장소에 대한 사용자 ID 및 암호를 지정하지 않고도 콜렉션을 검색할 수 있고 데이터를 보안하기 위해 액세스를 제어하는 API 세트입니다.
- IP 주소(IP address)
- IP 표준을 사용하는 네트워크의 디바이스 또는 논리 장치의 고유 주소입니다.
- JavaScript™
- 브라우저 및 웹 서버에서 사용되는 웹 스크립팅 언어입니다.
- JDBC(Java Database Connectivity)
- Java 플랫폼 및 다양한 범위의 데이터베이스 간의 데이터베이스 독립적인 연결을 위한 산업 규격입니다. JDBC 인터페이스는 SQL 기반 데이터베이스 액세스를 위한 호출 레벨 API를 제공합니다.
- JSP(JavaServer Pages)
- Java 코드를 웹 페이지(HTML 페이지) 내에 동적으로 임베드하고 페이지를 사용할 때 실행하여 동적 컨텐츠를 클라이언트에 리턴하는 서버 스크립팅 기술입니다.
- JVM(Java Virtual Machine)
- 컴파일된 Java 코드(애플릿 및 응용프로그램)를 실행하는 프로세서의 소프트웨어 구현입니다.
- LDAP(Lightweight Directory Access Protocol)
- X.500 모델을 지원하는 디렉토리에 액세스를 제공하기 위해 TCP/IP를 사용하며 더 복잡한 X.500 DAP(디렉토리 액세스 프로토콜)의 자원 요구사항이 필요하지 않는 오픈 프로토콜입니다. 예를 들어, LDAP을 사용하여 인터넷 또는 인트라넷 디렉토리에서 사람, 조직 및 다른 자원을 찾을 수 있습니다.
- Lotus QuickPlace 영역(Lotus QuickPlace room)
- 공통된 이해 및 공동 작업 필요성을 공유하는 권한 있는 구성원에게 제한되는 Lotus QuickPlace 작업공간의 파티션된 영역입니다.
- Lotus® QuickPlace® 작업공간(Lotus QuickPlace place)
- Lotus QuickPlace에서 제공하는 웹 장소로 지리적으로 분산된 참가자가 프로젝트에서 협업하고 구조화되고 보안된 작업공간에서 온라인으로 통신할 수 있게 해줍니다.
- MIME 유형(MIME type)
- 인터넷에서 전송되는 오브젝트 유형을 식별하기 위한 인터넷 표준입니다.
- n-gram 음절 분석(n-gram segmentation)
- 유니코드 기반 공백 문자 분석 방식에서처럼 단어를 구분하기 위해 공백을 사용하는 대신 지정된 개수의 오버랩되는 문자 시퀀스를 하나의 단어로 간주하는 분석 방법입니다.
- no-follow 지시문(no-follow directive)
- 웹 크롤러 같은 Robot에게 해당 페이지에 있는 링크를 따라가지 않도록 지시하는 웹 페이지의 지시문입니다.
- no-index 지시문(no-index directive)
- 웹 크롤러 같은 Robot에게 인덱스에 해당 페이지의 컨텐츠를 포함하지 않도록 지시하는 웹 페이지의 지시문입니다.
- Notes 리모트 프로시저 호출(NRPC, Notes remote procedure call)
- 모든 Notes 대 Notes 통신에 사용되는 Lotus Notes®의 통신 메커니즘입니다.
- SSL(Secure Sockets Layer)
- 통신 개인정보 보호를 제공하는 보안 프로토콜입니다. SSL을 사용하여 클라이언트/서버 응용프로그램은 도청, 도용 및 메시지 위조를 방지하기 위해 설계된 방식으로 통신할 수 있습니다.
- UIMA(Unstructured Information Management Architecture)
- 구조화되지 않은 데이터의 분석을 위한 시스템을 구현하기 위해 프레임워크를 정의하는 IBM 아키텍처입니다.
- URI(Uniform Resource Identifier)
- 추상 자원 또는 실제 자원을 식별하는 압축 문자열입니다.
- URL(Uniform Resource Locator)
- 인터넷 같은 네트워크에서 액세스할 수 있는 정보 자원의 고유 주소입니다. URL에는 정보 자원에 액세스하기 위해 사용한 프로토콜의 약식 이름과 정보 자원을 찾기 위해 프로토콜에서 사용한 정보가 들어 있습니다.
- XML 경로 언어(XPath, XML Path Language)
- XSLT, XQuery 및 XML 구문 분석기 같은 XML 관련 기술에 사용하기 위해 고유하게 식별하도록 설계된 언어 또는 소스 XML 데이터의 주소 부분입니다. XPath는 월드 와이드 웹(WWW) 컨소시엄 표준입니다.