These are the docs for the beta version of Evalite. Install with pnpm add evalite@beta

Built-in Scorers

Ready-to-use scorer functions for common evaluation patterns. Import from evalite/scorers.

import { exactMatch, faithfulness, toolCallAccuracy } from "evalite/scorers";

Evalite’s built-in scorers are deeply integrated with the Vercel AI SDK, making it easy to evaluate LLM outputs using standardized models and embeddings.

Many scorers require AI SDK models for LLM-based evaluation. Evalite makes these cheap to use by caching their results with wrapAISDKModel.

String Scorers

Simple deterministic scorers for text matching. No AI SDK required.

exactMatch - Exact string comparison
contains - Substring matching
levenshtein - Fuzzy string matching with edit distance

RAG Scorers

LLM-based scorers for evaluating retrieval-augmented generation systems. Require AI SDK models.

faithfulness - Detects hallucinations by checking if answers stick to provided context
answerSimilarity - Measures semantic similarity between answers using embeddings
answerCorrectness - Comprehensive evaluation combining factual accuracy and semantic similarity
answerRelevancy - Checks if AI actually answered the question (vs going off-topic)
contextRecall - Evaluates if retrieval system found the right documents

Advanced Scorers

Specialized scorers for specific use cases.

toolCallAccuracy - Verifies AI is calling correct functions with correct parameters
noiseSensitivity - Diagnoses if AI is misled by irrelevant documents in RAG systems

Quick Reference

Scorer	AI SDK Required	Use Case
exactMatch	No	Exact string matching
contains	No	Substring matching
levenshtein	No	Fuzzy string matching
faithfulness	Yes (LLM)	RAG hallucination detection
answerSimilarity	Yes (Embeddings)	Semantic similarity
answerCorrectness	Yes (LLM + Embeddings)	Comprehensive evaluation
answerRelevancy	Yes (LLM + Embeddings)	On-topic checking
contextRecall	Yes (LLM)	Retrieval quality
toolCallAccuracy	No	Function calling verification
noiseSensitivity	Yes (LLM)	RAG debugging

Built-in Scorers

String Scorers

RAG Scorers

Advanced Scorers

Quick Reference

See Also