Source code for kerb.memory.utils

"""Utility functions for memory management.

This module provides utility functions for working with conversation buffers:
- format_messages: Format messages for display or export
- filter_messages: Filter messages by various criteria
- merge_conversations: Merge multiple conversation buffers
- save_conversation: Save conversation buffer to file
- load_conversation: Load conversation buffer from file
- prune_buffer: Prune messages from buffer
"""

import json
from pathlib import Path
from typing import TYPE_CHECKING, List, Optional, Union

from kerb.core.types import Message

from .classes import Entity
from .entities import merge_entities

if TYPE_CHECKING:
    from .buffers import ConversationBuffer


def format_messages(
    messages: List[Message],
    format_style: str = "simple",
    include_metadata: bool = False,
) -> str:
    """Format messages for display or export.

    Args:
        messages: Messages to format
        format_style: "simple", "detailed", "json", or "chat"
        include_metadata: Whether to include metadata

    Returns:
        str: Formatted messages

    Example:
        >>> formatted = format_messages(messages, format_style="chat")
    """
    if not messages:
        return ""

    if format_style == "simple":
        lines = [f"{m.role}: {m.content}" for m in messages]
        return "\n".join(lines)

    elif format_style == "detailed":
        lines = []
        for msg in messages:
            lines.append(f"[{msg.timestamp}] {msg.role}:")
            lines.append(f"  {msg.content}")
            if include_metadata and msg.metadata:
                lines.append(f"  Metadata: {msg.metadata}")
        return "\n".join(lines)

    elif format_style == "json":
        data = [m.to_dict() for m in messages]
        return json.dumps(data, indent=2)

    elif format_style == "chat":
        lines = []
        for msg in messages:
            if msg.role == "user":
                lines.append(f"👤 User: {msg.content}")
            elif msg.role == "assistant":
                lines.append(f"🤖 Assistant: {msg.content}")
            elif msg.role == "system":
                lines.append(f"⚙️  System: {msg.content}")
            else:
                lines.append(f"{msg.role}: {msg.content}")
        return "\n".join(lines)

    return "\n".join(f"{m.role}: {m.content}" for m in messages)


def filter_messages(
    messages: List[Message],
    role: Optional[str] = None,
    contains: Optional[str] = None,
    start_time: Optional[str] = None,
    end_time: Optional[str] = None,
) -> List[Message]:
    """Filter messages by various criteria.

    Args:
        messages: Messages to filter
        role: Filter by role
        contains: Filter by content substring
        start_time: Filter by start time (ISO format)
        end_time: Filter by end time (ISO format)

    Returns:
        List[Message]: Filtered messages

    Example:
        >>> user_messages = filter_messages(messages, role="user")
    """
    filtered = messages

    if role:
        filtered = [m for m in filtered if m.role == role]

    if contains:
        contains_lower = contains.lower()
        filtered = [m for m in filtered if contains_lower in m.content.lower()]

    if start_time:
        filtered = [m for m in filtered if m.timestamp >= start_time]

    if end_time:
        filtered = [m for m in filtered if m.timestamp <= end_time]

    return filtered


def merge_conversations(
    *buffers: "ConversationBuffer", sort_by_time: bool = True
) -> "ConversationBuffer":
    """Merge multiple conversation buffers.

    Args:
        *buffers: Conversation buffers to merge
        sort_by_time: Whether to sort merged messages by timestamp

    Returns:
        ConversationBuffer: Merged buffer

    Example:
        >>> merged = merge_conversations(buffer1, buffer2)
    """
    from .buffers import ConversationBuffer

    merged = ConversationBuffer()

    # Merge messages
    all_messages = []
    for buffer in buffers:
        all_messages.extend(buffer.messages)

    if sort_by_time:
        all_messages.sort(key=lambda m: m.timestamp)

    merged.messages = all_messages

    # Merge summaries
    for buffer in buffers:
        merged.summaries.extend(buffer.summaries)

    # Merge entities
    for buffer in buffers:
        for key, entity in buffer.entities.items():
            if key in merged.entities:
                merged.entities[key] = merge_entities(merged.entities[key], entity)
            else:
                merged.entities[key] = entity

    return merged



[docs]
def save_conversation(
    buffer: "ConversationBuffer", filepath: Union[str, Path]
) -> None:
    """Save conversation buffer to a JSON file.

    Args:
        buffer: Conversation buffer to save
        filepath: Path to save file

    Example:
        >>> save_conversation(buffer, "conversation.json")
    """
    filepath = Path(filepath)
    data = buffer.to_dict()

    with open(filepath, "w", encoding="utf-8") as f:
        json.dump(data, f, indent=2, ensure_ascii=False)




[docs]
def load_conversation(filepath: Union[str, Path]) -> "ConversationBuffer":
    """Load conversation buffer from a JSON file.

    Args:
        filepath: Path to load file from

    Returns:
        ConversationBuffer: Loaded buffer

    Example:
        >>> buffer = load_conversation("conversation.json")
    """
    from .buffers import ConversationBuffer

    filepath = Path(filepath)

    with open(filepath, "r", encoding="utf-8") as f:
        data = json.load(f)

    buffer = ConversationBuffer()
    buffer.from_dict(data)
    return buffer



def prune_buffer(
    buffer: "ConversationBuffer",
    strategy: str = "oldest",
    keep_count: Optional[int] = None,
) -> "ConversationBuffer":
    """Prune messages from buffer based on strategy.

    Args:
        buffer: Buffer to prune
        strategy: Pruning strategy ("oldest", "newest", "alternating")
        keep_count: Number of messages to keep

    Returns:
        ConversationBuffer: Pruned buffer (new instance)

    Example:
        >>> pruned = prune_buffer(buffer, strategy="oldest", keep_count=10)
    """
    from .buffers import ConversationBuffer

    if keep_count is None:
        return buffer

    pruned = ConversationBuffer(
        max_messages=buffer.max_messages,
        enable_entity_tracking=buffer.enable_entity_tracking,
    )

    if len(buffer.messages) <= keep_count:
        pruned.messages = buffer.messages.copy()
        return pruned

    if strategy == "oldest":
        # Keep most recent messages
        pruned.messages = buffer.messages[-keep_count:]
    elif strategy == "newest":
        # Keep oldest messages
        pruned.messages = buffer.messages[:keep_count]
    elif strategy == "alternating":
        # Keep alternating messages evenly distributed
        indices = []
        step = len(buffer.messages) / keep_count
        for i in range(keep_count):
            idx = int(i * step)
            indices.append(idx)
        pruned.messages = [buffer.messages[i] for i in indices]
    else:
        # Default to oldest strategy
        pruned.messages = buffer.messages[-keep_count:]

    return pruned