3.6.6. LlamaIndex#
3.6.6.1. Overview#
3.6.6.1.1. Introduction#
Agents
Tác nhân là các trợ lý tri thức sử dụng mô hình ngôn ngữ lớn (LLM) và các công cụ để thực hiện nhiệm vụ như nghiên cứu, trích xuất dữ liệu, v.v.
Chúng có thể đơn giản như trả lời câu hỏi hoặc phức tạp hơn như cảm nhận, ra quyết định và hành động để hoàn thành nhiệm vụ.
LlamaIndex cung cấp khung để xây dựng tác nhân, trong đó tích hợp RAG (Retrieval-Augmented Generation) như một công cụ hỗ trợ.
Workflows
Quy trình công việc là các quá trình đa bước kết hợp nhiều tác nhân, trình kết nối dữ liệu và công cụ để hoàn thành nhiệm vụ.
Chúng là phần mềm điều khiển bởi sự kiện, cho phép kết hợp nguồn dữ liệu RAG và nhiều tác nhân để tạo ứng dụng phức tạp, có khả năng tự phản ánh, sửa lỗi và các đặc điểm của ứng dụng LLM tiên tiến.
Có thể triển khai các quy trình này dưới dạng microservices sản xuất.
Context Augmentation
LLM cung cấp giao diện ngôn ngữ tự nhiên giữa con người và dữ liệu, nhưng không được huấn luyện trên dữ liệu riêng của bạn (ví dụ: dữ liệu trong API, cơ sở dữ liệu SQL, PDF).
Tăng cường ngữ cảnh giúp LLM truy cập dữ liệu của bạn để giải quyết vấn đề cụ thể.
LlamaIndex cung cấp công cụ để ingest, parse, index và process, đồng thời triển khai nhanh các complex query workflows combining data access with LLM prompting. Ví dụ phổ biến nhất là RAG, kết hợp ngữ cảnh với LLM tại thời điểm suy luận.
LlamaIndex: là framework designed to build and manage the end-to-end lifecycle LLM-based application. LlamaIndex không giới hạn cách sử dụng LLM (tự động hoàn thành, chatbot, tác nhân, v.v.), mà giúp việc sử dụng dễ dàng hơn với các công cụ:
Data ingestion: Nhập dữ liệu từ nguồn gốc như API, PDF, SQL, v.v.
Data indexing: Cấu trúc dữ liệu thành dạng trung gian để LLM dễ sử dụng.
Engines:
Query Engine: Giao diện mạnh mẽ cho hỏi-đáp (ví dụ: quy trình RAG).
Chat Engine: Giao diện hội thoại cho tương tác đa tin nhắn.
Agent: Trợ lý tri thức dùng LLM và công cụ như hàm trợ giúp hoặc tích hợp API.
Observability/Evaluation: Thử nghiệm, đánh giá và giám sát ứng dụng.
Workflows: Kết hợp tất cả phần trên thành an event-driven system, linh hoạt hơn các cách tiếp cận dựa trên graph-based approaches.
3.6.6.1.2. Use cases#
Some popular use cases for LlamaIndex and context augmentation in general include:
Question-Answering (Retrieval-Augmented Generation aka RAG)
Autonomous Agents that can perform research and take actions
Multi-modal applications that combine text, images, and other data types
Fine-tuning models on data to improve performance
Check out our use cases documentation for more examples and links to tutorials.
3.6.6.1.3. How to LlamaIndex work#
LlamaIndex hoạt động theo ba giai đoạn chính: Nhập dữ liệu (Ingestion), Lập chỉ mục (Indexing), và Truy vấn (Querying). Những giai đoạn này kết nối dữ liệu của bạn với LLM để cung cấp câu trả lời chính xác hoặc thực hiện nhiệm vụ dựa trên thông tin bạn cung cấp.
Data Ingestion
Mục đích: Đưa dữ liệu riêng của bạn (từ PDF, cơ sở dữ liệu, API, v.v.) vào hệ thống để LLM có thể sử dụng.
Cách thực hiện:
LlamaIndex sử dụng trình kết nối dữ liệu (data connectors) để đọc dữ liệu từ nhiều nguồn khác nhau như tệp văn bản, PDF, SQL, hoặc API.
Ví dụ: Bạn có thể dùng SimpleDirectoryReader để tải tất cả tệp trong một thư mục hoặc LlamaHub để kết nối với hàng trăm nguồn dữ liệu khác nhau.
Công cụ như LlamaParse giúp phân tích cú pháp tài liệu phức tạp (như PDF) để trích xuất thông tin chính xác.
Indexing
Mục đích: Sắp xếp và cấu trúc dữ liệu để LLM dễ truy cập và xử lý nhanh chóng.
Cách thực hiện:
Dữ liệu được chuyển thành các vector embedding (biểu diễn số của văn bản) bằng các mô hình nhúng (embedding models) như OpenAI, HuggingFace, hoặc mô hình cục bộ.
Các embedding này được lưu trữ trong một cơ sở dữ liệu vector (vector store), tạo thành một chỉ mục (index).
Chỉ mục này giống như một “bản đồ” giúp LLM tìm kiếm thông tin liên quan mà không cần đọc toàn bộ dữ liệu từ đầu mỗi lần.
Querying
Mục đích: Sử dụng LLM để trả lời câu hỏi hoặc thực hiện nhiệm vụ dựa trên dữ liệu đã lập chỉ mục.
Cách thực hiện:
Khi bạn đặt câu hỏi, LlamaIndex tìm kiếm trong chỉ mục để lấy các phần dữ liệu liên quan nhất (thường dùng kỹ thuật RAG - Retrieval-Augmented Generation).
Dữ liệu này được kết hợp với câu hỏi của bạn và gửi đến LLM để tạo câu trả lời.
Có nhiều cách truy vấn:
Query Engine: Trả lời câu hỏi đơn giản (ví dụ: “Doanh thu năm 2023 là bao nhiêu?”).
Chat Engine: Hỗ trợ hội thoại qua lại.
Agents: Thực hiện nhiệm vụ phức tạp hơn như phân tích hoặc nghiên cứu.
Ví dụ cụ thể về cách hoạt động
Giả sử bạn có một thư mục chứa các tài liệu PDF về báo cáo tài chính:
Data Ingest: Bạn chạy mã để tải tất cả PDF bằng SimpleDirectoryReader.
Index: LlamaIndex chuyển nội dung PDF thành vector embedding và lưu vào cơ sở dữ liệu vector.
Query: Bạn hỏi “Tổng lợi nhuận năm 2024 là bao nhiêu?”. LlamaIndex tìm đoạn văn bản liên quan trong chỉ mục, gửi nó cùng câu hỏi đến LLM (như GPT), và trả về câu trả lời chính xác.
Các thành phần hỗ trợ hoạt động
Tools: LlamaIndex cho phép tích hợp các công cụ bổ sung (như API, hàm tùy chỉnh) để mở rộng khả năng của LLM.
Agents: Các trợ lý thông minh dùng LLM và công cụ để thực hiện nhiệm vụ phức tạp, ví dụ: phân tích dữ liệu hoặc tự động trả lời email.
Workflows: Điều khiển các bước bằng sự kiện, kết hợp nhiều tác nhân và nguồn dữ liệu để xử lý ứng dụng phức tạp.
Context Augmentation: Đảm bảo LLM hiểu và sử dụng dữ liệu riêng của bạn thay vì chỉ dựa vào kiến thức chung.
from dotenv import load_dotenv
load_dotenv(r".env")
True
3.6.6.2. Models#
3.6.6.2.1. LLMs#
Support for text completion and chat endpoints (details below)
Support for streaming and non-streaming endpoints
Support for synchronous and asynchronous endpoints
Check list of supported models in the LLM Integrations.
3.6.6.2.1.1. Text Completion#
%pip install -qU llama-index-llms-openai
Note: you may need to restart the kernel to use updated packages.
from llama_index.llms.openai import OpenAI
model = OpenAI(
model="gpt-4o-mini",
temperature=0.2,
max_tokens=50,
additional_kwargs={"seed": 12345678, "top_p": 0.5},
)
normal mode
response = model.complete("Hello, how are you?")
print(response)
Hello! I'm just a program, so I don't have feelings, but I'm here and ready to help you. How can I assist you today?
Streaming mode: Kết quả trả về sẽ được trả về từng phần một, không phải là một câu hoàn chỉnh. Điều này có thể hữu ích trong các trường hợp mà bạn muốn nhận phản hồi ngay lập tức hoặc khi bạn đang làm việc với một mô hình lớn và không muốn chờ đợi toàn bộ phản hồi.
from time import sleep
# streaming mode
handle = model.stream_complete("William Shakespeare is ")
for token in handle:
print(token.delta, end="", flush=True)
sleep(0.1) # simulate some delay
William Shakespeare (1564-1616) was an English playwright, poet, and actor, widely regarded as one of the greatest writers in the English language and the world's pre-eminent dramatist. His works include 39 plays, 154 son
Async mode: Kết quả trả về sẽ được trả về dưới dạng một đối tượng bất đồng bộ, cho phép bạn xử lý kết quả khi nó sẵn sàng mà không cần chờ đợi toàn bộ phản hồi.
Async streaming mode: Kết quả trả về sẽ được trả về từng phần một dưới dạng một đối tượng bất đồng bộ, cho phép bạn xử lý kết quả ngay lập tức mà không cần chờ đợi toàn bộ phản hồi.
# with async
model.acomplete("Hello, how are you?")
# stream with async
model.astream_complete("Hello, how are you?")
3.6.6.2.1.2. Chat Interface#
from llama_index.llms.openai import OpenAI
from llama_index.core.llms import ChatMessage
model = OpenAI("gpt-4o-mini", temperature=0.1, max_tokens=50)
messages = [
ChatMessage(role="system", content="Bạn là một trợ lý ảo thông minh."),
ChatMessage(role="user", content="Cho tôi 1 câu đùa về tình yêu"),
]
chat_response = model.chat(messages)
print(chat_response)
assistant: Tình yêu giống như Wi-Fi, bạn không thể nhìn thấy nó, nhưng khi có tín hiệu tốt, bạn sẽ cảm thấy kết nối mạnh mẽ!
3.6.6.2.1.3. Function Calling#
Function calling: Cho phép bạn gọi các hàm từ mã nguồn bên ngoài trong khi tương tác với mô hình ngôn ngữ. Điều này có thể hữu ích trong các trường hợp mà bạn muốn thực hiện các tác vụ cụ thể hoặc truy cập dữ liệu bên ngoài trong khi tương tác với mô hình.
from llama_index.core.tools import FunctionTool
from llama_index.llms.openai import OpenAI
def generate_song(name: str, artist: str) -> dict:
"""Generates a song with provided name and artist."""
return {"name": name, "artist": artist}
tool = FunctionTool.from_defaults(fn=generate_song)
llm = OpenAI(model="gpt-4o-mini")
response = llm.predict_and_call(
[tool],
"Generate a random song for me. Use the generate_song function to create a song with a name and artist.",
)
print(str(response))
{'name': 'Whispers in the Wind', 'artist': 'Luna Sky'}
3.6.6.2.1.4. Advanced Custom Model#
from typing import Optional, List, Mapping, Any
from llama_index.core import SimpleDirectoryReader, SummaryIndex
from llama_index.core.callbacks import CallbackManager
from llama_index.core.llms import (
CustomLLM,
CompletionResponse,
CompletionResponseGen,
LLMMetadata,
)
from llama_index.core.llms.callbacks import llm_completion_callback
from llama_index.core import Settings
class OurLLM(CustomLLM):
context_window: int = 3900
num_output: int = 256
model_name: str = "custom"
dummy_response: str = "My response"
@property
def metadata(self) -> LLMMetadata:
"""Get LLM metadata."""
return LLMMetadata(
context_window=self.context_window,
num_output=self.num_output,
model_name=self.model_name,
)
@llm_completion_callback()
def complete(self, prompt: str, **kwargs: Any) -> CompletionResponse:
return CompletionResponse(text=self.dummy_response)
@llm_completion_callback()
def stream_complete(self, prompt: str, **kwargs: Any) -> CompletionResponseGen:
response = ""
for token in self.dummy_response:
response += token
yield CompletionResponse(text=response, delta=token)
# define our LLM
Settings.llm = OurLLM()
# define embed model
Settings.embed_model = "local:BAAI/bge-base-en-v1.5"
# Load the your data
documents = SimpleDirectoryReader("./data").load_data()
index = SummaryIndex.from_documents(documents)
# Query and print response
query_engine = index.as_query_engine()
response = query_engine.query("<query_text>")
print(response)
3.6.6.2.1.5. local Models#
See the custom LLM’s How-To for more details on using and configuring LLM models.
from llama_index.llms.ollama import Ollama # type: ignore
llm = Ollama(model="llama3.3", request_timeout=60.0)
3.6.6.2.1.6. Multi modal#
ref: https://docs.llamaindex.ai/en/stable/module_guides/models/multi_modal/
from llama_index.core.llms import ChatMessage, TextBlock, ImageBlock
from llama_index.llms.openai import OpenAI
llm = OpenAI(model="gpt-4o")
messages = [
ChatMessage(
role="user",
blocks=[
ImageBlock(
path=r"C:\Users\datkt\Desktop\Working\notebooks\coding\learning\contents\theory\aiml_algorithms\dl_llm\_images\vector_db_meaning.png"
),
TextBlock(text="Describe the image in a few sentences."),
],
)
]
resp = llm.chat(messages)
print(resp.message.content)
The image illustrates the concept of a vector database. On the left, it shows unstructured data represented by icons for different file types: JPG, DOC, MP4, and MP3. On the right, it displays a table of embeddings, which are numerical vectors associated with the unstructured data. The embeddings consist of rows of numbers, indicating how the data is transformed into a structured format for storage and retrieval in a vector database.
3.6.6.2.2. Embedding Models#
LlamaIndex uses
text-embedding-ada-002
from OpenAI and uses cosine similarity when comparing embeddings.
Use OpenAI embedding model
%pip install -qU llama-index-embeddings-openai
Note: you may need to restart the kernel to use updated packages.
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.core import VectorStoreIndex
from llama_index.core import Settings
# changing the global default
Settings.embed_model = OpenAIEmbedding()
# local usage
embedding = OpenAIEmbedding().get_text_embedding("hello world")
embeddings = OpenAIEmbedding().get_text_embeddings(["hello world", "hello world"])
# per-index
index = VectorStoreIndex.from_documents(documents, embed_model=embed_model)
Use HuggingFace embedding model (local)
%pip install -qU llama-index-embeddings-huggingface
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
from llama_index.core import Settings
Settings.embed_model = HuggingFaceEmbedding(model_name="BAAI/bge-small-en-v1.5")
Customized embedding model: link
3.6.6.3. Prompts#
LlamaIndex provides a flexible and powerful way to manage prompts, and to use them in a variety of ways.
RichPromptTemplate
- latest-style for building jinja-style prompts with variables and logicPromptTemplate
- older-style simple templating for building prompts with a single f-stringChatPromptTemplate
- older-style simple templating for building chat prompts with messages and f-strings
3.6.6.3.1. PromptTemplate#
PromptTemplate
là một lớp cơ bản cho việc xây dựng các prompt đơn giản với một chuỗi f-string. Nó cho phép bạn định nghĩa một prompt với các biến và sau đó sử dụng nó để tạo ra các prompt cụ thể bằng cách thay thế các biến bằng giá trị thực tế.
import datetime
# Sử dụng f-string để minh họa đơn giản nhất
# (PromptTemplate cơ bản cũng tương tự về mặt cấu trúc logic)
def create_basic_prompt(text: str, audience: str) -> str:
"""Tạo prompt bằng cách ghép chuỗi và logic đơn giản."""
current_date = datetime.date.today().isoformat() # Lấy ngày hiện tại
# Logic xử lý đối tượng được nhúng trực tiếp
if audience == "chuyên gia kỹ thuật":
audience_instruction = (
"Tập trung vào chi tiết kỹ thuật, có thể dùng thuật ngữ chuyên ngành."
)
elif audience == "người mới bắt đầu":
audience_instruction = "Giải thích đơn giản, dễ hiểu, tránh thuật ngữ phức tạp."
else:
audience_instruction = "Viết một cách tổng quát."
# Logic định dạng JSON được nhúng trực tiếp
format_instruction = f"""
Yêu cầu định dạng Output:
Trả về kết quả dưới dạng một đối tượng JSON hợp lệ như sau:
{{
"summary": "<nội dung tóm tắt của bạn ở đây>",
"generated_date": "{current_date}"
}}
"""
# Ghép nối tất cả lại thành một prompt lớn
prompt = f"""
Hãy tóm tắt đoạn văn bản sau đây:
--- Văn bản bắt đầu ---
{text}
--- Văn bản kết thúc ---
Hướng dẫn tóm tắt:
1. Đối tượng người đọc: {audience}. {audience_instruction}
2. {format_instruction}
Chỉ trả về đối tượng JSON, không thêm bất kỳ lời giải thích nào khác.
"""
return prompt
# --- Sử dụng ---
my_text = "LlamaIndex là một framework mạnh mẽ giúp xây dựng các ứng dụng dựa trên LLM bằng cách kết nối các nguồn dữ liệu tùy chỉnh với LLM."
audience_type = "người mới bắt đầu"
basic_prompt_result = create_basic_prompt(my_text, audience_type)
print("--- Prompt tạo bằng phương pháp cũ ---")
print("-" * 20)
print(basic_prompt_result)
--- Prompt tạo bằng phương pháp cũ ---
--------------------
Hãy tóm tắt đoạn văn bản sau đây:
--- Văn bản bắt đầu ---
LlamaIndex là một framework mạnh mẽ giúp xây dựng các ứng dụng dựa trên LLM bằng cách kết nối các nguồn dữ liệu tùy chỉnh với LLM.
--- Văn bản kết thúc ---
Hướng dẫn tóm tắt:
1. Đối tượng người đọc: người mới bắt đầu. Giải thích đơn giản, dễ hiểu, tránh thuật ngữ phức tạp.
2.
Yêu cầu định dạng Output:
Trả về kết quả dưới dạng một đối tượng JSON hợp lệ như sau:
{
"summary": "<nội dung tóm tắt của bạn ở đây>",
"generated_date": "2025-04-11"
}
Chỉ trả về đối tượng JSON, không thêm bất kỳ lời giải thích nào khác.
3.6.6.3.2. RichPromptTemplate#
By leveraging Jinja syntax, you can build prompt templates that have variables, logic, parse objects, and more.
Nhúng các Đối tượng Phức tạp: Khác với các phương pháp chỉ xử lý biến dạng chuỗi (string),
RichPromptTemplate
cho phép bạn nhúng trực tiếp các đối tượng phức tạp vào trong template. Các đối tượng này có thể là:Các
PromptTemplate
khác (lồng ghép prompt).Các hàm Python (functions).
Các Pydantic models tùy chỉnh.
Khả năng Kết hợp (Composition): Đây là ưu điểm cốt lõi.
RichPromptTemplate
giúp bạn xây dựng các prompt lớn và phức tạp từ những “mảnh ghép” nhỏ hơn, dễ quản lý hơn. Bạn có thể định nghĩa các phần prompt riêng lẻ (dưới dạng prompt khác hoặc hàm) và sau đó kết hợp chúng lại bằngRichPromptTemplate
. Điều này giống như việc xây dựng một ứng dụng lớn từ các module nhỏ.Tính Module và Tái sử dụng (Modularity & Reusability): Khi bạn tách các phần của prompt thành các đối tượng riêng biệt (như hàm hoặc prompt con), bạn có thể dễ dàng tái sử dụng chúng ở nhiều nơi khác nhau. Nếu cần cập nhật logic hoặc nội dung của một phần, bạn chỉ cần sửa ở một nơi thay vì tìm kiếm và thay đổi ở nhiều chuỗi prompt dài.
Tổ chức và Quản lý Code Tốt hơn: Đối với các prompt rất phức tạp, việc sử dụng
RichPromptTemplate
giúp mã nguồn của bạn trở nên rõ ràng, có cấu trúc và dễ bảo trì hơn so với việc quản lý một chuỗi định dạng (f-string) khổng lồ hoặc mộtPromptTemplate
đơn lẻ với quá nhiều biến.
3.6.6.3.2.1. Simple Prompt#
# use the RichPromptTemplate to build a jinja-style prompt template
from llama_index.core.prompts import RichPromptTemplate
template_str = """We have provided context information below.
---------------------
{{ context_str }}
---------------------
Given this information, please answer the question: {{ query_str }}
"""
qa_template = RichPromptTemplate(template_str)
# you can create text prompt (for completion API)
prompt = qa_template.format(context_str="context_sample", query_str="query_sample")
# or easily convert to message prompts (for chat API)
messages = qa_template.format_messages(
context_str="context_sample", query_str="context_sample"
)
print(prompt)
We have provided context information below.
---------------------
context_sample
---------------------
Given this information, please answer the question: query_sample
print(messages)
messages[0].content
[ChatMessage(role=<MessageRole.USER: 'user'>, additional_kwargs={}, blocks=[TextBlock(block_type='text', text='We have provided context information below.'), TextBlock(block_type='text', text='---------------------'), TextBlock(block_type='text', text='context_sample'), TextBlock(block_type='text', text='---------------------'), TextBlock(block_type='text', text='Given this information, please answer the question: context_sample')])]
'We have provided context information below.---------------------context_sample---------------------Given this information, please answer the question: context_sample'
3.6.6.3.2.2. Loop in Prompt#
from llama_index.core.prompts import RichPromptTemplate
template = RichPromptTemplate(
"""
{% chat role="system" %}
Given a list if images and text from each image, please answer the question to the best of your ability.
{% endchat %}
{% chat role="user" %}
{% for image_path, text in images_and_texts %}
Here is some text: {{ text }}
And here is an image:
{{ image_path | image }}
{% endfor %}
{% endchat %}
"""
)
messages = template.format_messages(
images_and_texts=[
(
r"contents\theory\aiml_algorithms\dl_llm\_images\rag_diagram.png",
"This is the first page of the document",
),
(
r"contents\theory\aiml_algorithms\dl_llm\_images\rag_flow.png",
"This is the second page of the document",
),
]
)
messages
[ChatMessage(role=<MessageRole.SYSTEM: 'system'>, additional_kwargs={}, blocks=[TextBlock(block_type='text', text='Given a list if images and text from each image, please answer the question to the best of your ability.')]),
ChatMessage(role=<MessageRole.USER: 'user'>, additional_kwargs={}, blocks=[TextBlock(block_type='text', text='Here is some text: This is the first page of the document'), TextBlock(block_type='text', text='And here is an image:'), ImageBlock(block_type='image', image=None, path=None, url=AnyUrl(''), image_mimetype=None, detail=None), TextBlock(block_type='text', text='Here is some text: This is the second page of the document'), TextBlock(block_type='text', text='And here is an image:'), ImageBlock(block_type='image', image=None, path=None, url=AnyUrl(''), image_mimetype=None, detail=None)])]
the
{% chat %}
block is used to format the message as a chat message and set the rolethe
{% for %}
loop is used to iterate over the images_and_texts list that is passed inthe
{{ image_path | image }}
syntax is used to format the image path as an image content block. Here,|
is used to apply a “filter” to the variable to help identify it as an image.
3.6.6.3.2.3. Retriever in Prompt#
from llama_index.core.prompts import RichPromptTemplate
template = RichPromptTemplate(
"""
{% chat role="system" %}
You are a helpful assistant that can answer questions about the context provided.
{% endchat %}
{% chat role="user" %}
{% for node in nodes %}
{{ node.text }}
{% endfor %}
{% endchat %}
"""
)
nodes = retriever.retrieve("What is the capital of the moon?")
messages = template.format_messages(nodes=nodes)
3.6.6.3.2.4. Function Mappings#
Tính năng function_mappings
của RichPromptTemplate cho phép bạn chỉ định một hàm Python để tự động xử lý giá trị của một biến placeholder ngay trước khi nó được đưa vào prompt cuối cùng.
import datetime
from llama_index.core.prompts import RichPromptTemplate
# 1. Hàm để lấy lời chào dựa trên giờ hiện tại
def get_dynamic_greeting(**kwargs) -> str:
"""Trả về lời chào phù hợp với thời gian trong ngày."""
# Lưu ý: Hàm này không cần dùng kwargs trong ví dụ này,
# nhưng vẫn cần định nghĩa **kwargs để tương thích với cách RichPromptTemplate gọi nó.
now = datetime.datetime.now()
current_hour = now.hour
if 5 <= current_hour < 12:
return "Chào buổi sáng!"
elif 12 <= current_hour < 18:
return "Chào buổi chiều!"
else:
return "Chào buổi tối!"
# 2. Định nghĩa RichPromptTemplate
# Placeholder {{ greeting }} sẽ được điền bằng kết quả của hàm get_dynamic_greeting
# Placeholder {{ user_task }} sẽ được điền bình thường từ input.
template_string = """
{{greeting}} Tôi có thể giúp gì cho bạn hôm nay?
Yêu cầu của bạn: {{user_task}}
"""
# 3. Tạo template và đăng ký function mapping
# Map placeholder "greeting" với hàm get_dynamic_greeting
prompt_tmpl = RichPromptTemplate(
template_string, function_mappings={"greeting": get_dynamic_greeting}
)
# 4. Sử dụng template
# Chỉ cần cung cấp giá trị cho các placeholder không có function mapping
user_request = "Hãy tóm tắt tin tức mới nhất về AI."
final_prompt_str = prompt_tmpl.format(user_task=user_request)
# In kết quả - bạn sẽ thấy lời chào được tự động thêm vào
print("--- Prompt cuối cùng ---")
print(final_prompt_str)
# Ví dụ kết quả (tùy thuộc vào thời gian bạn chạy code):
# --- Prompt cuối cùng ---
#
# Chào buổi chiều! Tôi có thể giúp gì cho bạn hôm nay?
#
# Yêu cầu của bạn: Hãy tóm tắt tin tức mới nhất về AI.
--- Prompt cuối cùng ---
Chào buổi chiều! Tôi có thể giúp gì cho bạn hôm nay?
Yêu cầu của bạn: Hãy tóm tắt tin tức mới nhất về AI.
3.6.6.3.2.5. Partial Formatting#
Partially format a prompt, filling in some variables while leaving others to be filled in later.
from llama_index.core.prompts import RichPromptTemplate
template = RichPromptTemplate(
"""
{{ foo }} {{ bar }}
"""
)
partial_prompt_tmpl = template.partial_format(foo="abc")
print(partial_prompt_tmpl)
fmt_str = partial_prompt_tmpl.format(bar="def")
print(fmt_str)
metadata={} template_vars=['bar', 'foo'] kwargs={'foo': 'abc'} output_parser=None template_var_mappings=None function_mappings=None template_str='\n{{ foo }} {{ bar }}\n'
abc def
3.6.6.3.2.6. Complex Prompt#
Tình huống: Chúng ta muốn tạo một prompt để yêu cầu mô hình ngôn ngữ (LLM) tóm tắt một đoạn văn bản (text). Tuy nhiên, prompt này cần có thêm:
Chỉ dẫn theo đối tượng: Hướng dẫn LLM cách tóm tắt tùy thuộc vào đối tượng người đọc (audience - ví dụ: “chuyên gia kỹ thuật” hoặc “người mới bắt đầu”).
Định dạng Output: Yêu cầu LLM trả về kết quả dưới dạng JSON chứa bản tóm tắt và ngày tạo.
Thông tin động: Chèn ngày hiện tại vào yêu cầu định dạng JSON.
import datetime
from llama_index.core.prompts import RichPromptTemplate
# Component 1: Hàm tạo hướng dẫn theo đối tượng
def get_audience_instruction(**kwargs) -> str:
"""Trả về hướng dẫn dựa trên đối tượng."""
audience = kwargs.get("audience")
if audience == "chuyên gia kỹ thuật":
return "Tập trung vào chi tiết kỹ thuật, có thể dùng thuật ngữ chuyên ngành."
elif audience == "người mới bắt đầu":
return "Giải thích đơn giản, dễ hiểu, tránh thuật ngữ phức tạp."
else:
return "Viết một cách tổng quát."
# Component 2: Hàm tạo yêu cầu định dạng JSON (bao gồm ngày)
def get_json_format_instruction(**kwangs) -> str:
"""Trả về yêu cầu định dạng JSON với ngày hiện tại."""
current_date = datetime.date.today().isoformat()
return f"""Yêu cầu định dạng Output:
Trả về kết quả dưới dạng một đối tượng JSON hợp lệ như sau:
{{
"summary": "<nội dung tóm tắt của bạn ở đây>",
"generated_date": "{current_date}"
}}
Chỉ trả về đối tượng JSON, không thêm bất kỳ lời giải thích nào khác.
"""
main_structure = """
Hãy tóm tắt đoạn văn bản sau đây:
--- Văn bản bắt đầu ---
{text}
--- Văn bản kết thúc ---
Hướng dẫn tóm tắt:
1. Đối tượng người đọc: {{audience}}. {{audience_instruction}}
2. {{format_instruction}}
"""
prompt_tmpl = RichPromptTemplate(
main_structure,
function_mappings={
"audience_instruction": get_audience_instruction,
"format_instruction": get_json_format_instruction,
},
)
my_text = "LlamaIndex là một framework mạnh mẽ giúp xây dựng các ứng dụng dựa trên LLM bằng cách kết nối các nguồn dữ liệu tùy chỉnh với LLM."
audience_type = "người mới bắt đầu"
# Format template, truyền cả biến và hàm
rich_prompt_result = prompt_tmpl.format(
text=my_text,
audience=audience_type,
)
print(rich_prompt_result)
Hãy tóm tắt đoạn văn bản sau đây:
--- Văn bản bắt đầu ---
{text}
--- Văn bản kết thúc ---
Hướng dẫn tóm tắt:
1. Đối tượng người đọc: người mới bắt đầu. Giải thích đơn giản, dễ hiểu, tránh thuật ngữ phức tạp.
2. Yêu cầu định dạng Output:
Trả về kết quả dưới dạng một đối tượng JSON hợp lệ như sau:
{
"summary": "<nội dung tóm tắt của bạn ở đây>",
"generated_date": "2025-04-11"
}
Chỉ trả về đối tượng JSON, không thêm bất kỳ lời giải thích nào khác.
3.6.6.4. Build RAG#
RAG: Retrieval-Augmented Generation (RAG) là một kỹ thuật trong lĩnh vực xử lý ngôn ngữ tự nhiên (NLP) kết hợp giữa việc truy xuất thông tin và sinh văn bản. Mục tiêu của RAG là cải thiện khả năng sinh văn bản của các mô hình ngôn ngữ bằng cách cung cấp thông tin bổ sung từ các nguồn bên ngoài trong quá trình sinh văn bản.
In RAG, your data is loaded and prepared for queries or “indexed”. User queries act on the index, which filters your data down to the most relevant context. This context and your query then go to the LLM along with a prompt, and the LLM provides a response.
RAG pipeline: Một quy trình RAG bao gồm các stage sau:
Loading: Tải dữ liệu từ các nguồn khác nhau như cơ sở dữ liệu, tệp văn bản, hoặc API. Sử dụng LlamaHub cung cấp các connector cho các nguồn dữ liệu phổ biến.
Indexing: Tạo Index từ dữ liệu đã tải để dễ dàng truy xuất thông tin, gần giống như
vector embedding
(vector hoá data dựa trên câu chữ và ngữ nghĩa).Storing: Lưu trữ Index + Metadata liên quan trong một cơ sở dữ liệu hoặc một hệ thống lưu trữ để có thể truy xuất sau này.
Querying: Khi người dùng gửi một truy vấn, hệ thống sẽ tìm kiếm trong Index để tìm các phần dữ liệu liên quan, trong đó gồm sub-queries, multi-step queries và hybrid strategies.
Evaluating: Đánh giá kết quả truy vấn để đảm bảo rằng nó đáp ứng yêu cầu của người dùng. Điều này có thể bao gồm việc kiểm tra độ chính xác, độ tin cậy và tính liên quan của kết quả.
3.6.6.4.1. Loading & Ingestion#
1. Một số thuật ngữ:
Document: Một đơn vị dữ liệu cơ bản trong LlamaIndex, có thể là một đoạn văn bản, một tệp tin hoặc một đối tượng dữ liệu khác. Đại diện cho data source.
Node: Một phần tử trong Document (giống như
chunk
), bao gồm data và metadata liên quan. Node có thể được sử dụng để tổ chức và truy xuất thông tin trong Document.Connector: là Reader cho phép bạn tải dữ liệu từ các nguồn khác nhau, chẳng hạn như cơ sở dữ liệu, tệp tin hoặc API.
2. Các bước
Load data: Tải dữ liệu từ các nguồn khác nhau bằng cách sử dụng các connector có sẵn trong LlamaHub hoặc tự định nghĩa connector của riêng bạn.
Chunk data: Chia nhỏ dữ liệu thành các phần tử nhỏ hơn (nodes) để dễ dàng xử lý và truy xuất thông tin. Điều này có thể bao gồm việc chia nhỏ văn bản thành các đoạn văn bản ngắn hơn hoặc chia nhỏ tệp tin thành các phần tử nhỏ hơn.
Extract metadata: Trích xuất thông tin bổ sung từ dữ liệu đã tải, chẳng hạn như tiêu đề, tác giả hoặc ngày tháng. Metadata có thể được sử dụng để tổ chức và truy xuất thông tin trong Document.
Embed data: Chuyển đổi dữ liệu và metadata thành các vector để dễ dàng truy xuất và xử lý. Điều này có thể bao gồm việc sử dụng các mô hình nhúng (embedding models) để chuyển đổi văn bản thành các vector hoặc sử dụng các phương pháp khác để chuyển đổi dữ liệu thành các định dạng có thể xử lý được.
3.6.6.4.1.1. Components#
3.6.6.4.1.1.1. Document#
# Documents
from llama_index.core import Document
from llama_index.core.schema import MetadataMode
document = Document(
text="This is a super-customized document",
metadata={
"file_name": "super_secret_document.txt",
"category": "finance",
"author": "LlamaIndex",
},
excluded_llm_metadata_keys=["file_name"],
metadata_seperator="::",
metadata_template="{key}=>{value}",
text_template="Metadata: {metadata_str}\n-----\nContent: {content}",
)
print(
"The LLM sees this: \n",
document.get_content(metadata_mode=MetadataMode.LLM),
)
print("**********************************************")
print(
"The Embedding model sees this: \n",
document.get_content(metadata_mode=MetadataMode.EMBED),
)
The LLM sees this:
Metadata: category=>finance::author=>LlamaIndex
-----
Content: This is a super-customized document
**********************************************
The Embedding model sees this:
Metadata: file_name=>super_secret_document.txt::category=>finance::author=>LlamaIndex
-----
Content: This is a super-customized document
3.6.6.4.1.1.2. Node#
Node là một phần tử trong Document, bao gồm data và metadata liên quan. Node có thể được sử dụng để tổ chức và truy xuất thông tin trong Document.
from llama_index.core.node_parser import SentenceSplitter
parser = SentenceSplitter()
nodes = parser.get_nodes_from_documents(documents)
nodes
[TextNode(id_='eb01d439-f7bc-42de-80f2-e7e570335e66', embedding=None, metadata={'page_label': '1', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\MediaCentre-FunFacts_EN_1.pdf'}, excluded_embed_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], excluded_llm_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\MediaCentre-FunFacts_EN_1.pdf_part_0', node_type=<ObjectType.DOCUMENT: '4'>, metadata={'page_label': '1', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\MediaCentre-FunFacts_EN_1.pdf'}, hash='6f4cef12d13b0a7b4db6f9ffa853df65da721d6f9e3e4f3c93197afdff426adc')}, metadata_template='{key}: {value}', metadata_separator='\n', text='We may be known as the Great White North, but we’re also green and blue! Did you know Canada \nhas more lakes than the rest of the world combined and is home to 10% of the world’s forests? \nSome of its national parks are bigger than entire countries! \nWild about wildlife: Canada is home to 2.4 million caribou and 15,500 of the world’s 25,000 polar \nbears, not to mention home to 22 different species of whales. \nCanada’s Great Trail, a network of trails stretching across the country from coast-to-coast-to-coast, \nis the longest recreational trail in the world. At 24,000km of land- and water-based trail, it’s longer \nthan the Great Wall of China (8,851km).\nCanada is made for outdoor adventurers. Did you know you can raft-surf the world’s highest tides \nat the Bay of Fundy, paddle with orcas in British Columbia, track the largest caribou migration in \nNunavut or kayak past icebergs and humpback whales in Newfoundland and Labrador?\nCanada is known as a diverse nation that’s welcoming to immigrants. In 2016, over 250 ethnic \nancestries were reported by the Canadian population, contributing to a rich and vibrant culture and \nculinary scene.\nWell-educated: More than half of Canadians have earned college degrees, making it the world’s \nmost educated nation. \nCanada is home to North America’s only remaining walled city—the historic neighbourhood of \nOld Quebec, also the first city in North America to be placed on UNESCO’s World Heritage Sites list. \nCanada has the world’s most northern settlement: Alert, Nunavut, just shy of the North Pole. That’s \nwhy Santa has his own Canada Post postal code here, (H0H 0H0), where kids can send him letters \nat Christmas (he responds).\nCan you guess Canada’s most played sport? Perhaps a bit surprising, it’s golf, followed by the \nbeloved national pastime, ice hockey. \nFun Facts About Canada', mimetype='text/plain', start_char_idx=0, end_char_idx=1845, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='6ec59223-5404-4cf2-a082-cc2f43485899', embedding=None, metadata={'page_label': '2', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\MediaCentre-FunFacts_EN_1.pdf'}, excluded_embed_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], excluded_llm_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\MediaCentre-FunFacts_EN_1.pdf_part_1', node_type=<ObjectType.DOCUMENT: '4'>, metadata={'page_label': '2', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\MediaCentre-FunFacts_EN_1.pdf'}, hash='89bb93f9d3aa95873447df619d76fef16f47fa9e43c878c3c056a7c6c6d8ca69')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Canada produces 70% of the world’s maple syrup — and nearly all of it comes from \nQuebec maples. \nCanadians love their poutine, but are crazy about decadent dough rings! Canada has the most \ndoughnut shops per capita in the world and its people consume the most doughnuts of anywhere \nelse in the world.\nOttawa, Canada’s capital region, houses the country’s most precious cultural treasures. Eight of \nCanada’s nine national museums and galleries are located here. The ninth is the Canadian Museum \nfor Human Rights in Winnipeg, Manitoba.\nCanada is home to the longest running ballet company in North America – the internationally \nrenowned Royal Winnipeg Ballet in Manitoba is the oldest ballet company in Canada. \nCanada is the number 1 travel destination in the world, according to Travel + Leisure magazine \n(2017) (and Lonely Planet), singled out for its unspoiled landscapes, dynamic cities, cultural \ninstitutions and welcoming spirit.\nkeepexploring.ca', mimetype='text/plain', start_char_idx=0, end_char_idx=962, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='1b35c9fc-cf2d-491f-a5a7-0b34f221114c', embedding=None, metadata={'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\README.md'}, excluded_embed_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], excluded_llm_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\README.md', node_type=<ObjectType.DOCUMENT: '4'>, metadata={'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\README.md'}, hash='31d6394f6dd92d4114920f6aac8ee2a1c7fb21104a6ea0e328bf2e0f8ffc8736')}, metadata_template='{key}: {value}', metadata_separator='\n', text='# PDF Sample Files\n\nThis repository provides files for testing software that reads / parses\nPDF files.\n\nThe `files.json` file contains a list of those PDF files with their metadata.\n\n## Licenses\n\nEvery PDF in this repository is under the Creative Commons\nAttribution-ShareAlike License (CC-BY-SA-4.0).\n\n\n## Contributions\n\nPlease contribute files to fill this repository! Just create a PR with a\nPDF file created by you.', mimetype='text/plain', start_char_idx=0, end_char_idx=419, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='7e18c4c3-f11c-4469-b2c7-01cc493459ba', embedding=None, metadata={'page_label': '1', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf'}, excluded_embed_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], excluded_llm_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf_part_0', node_type=<ObjectType.DOCUMENT: '4'>, metadata={'page_label': '1', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf'}, hash='9438d9cdc2355857a3c3274a5fe3541da739b575c326d2c6a108cd7feee77eab')}, metadata_template='{key}: {value}', metadata_separator='\n', text='THE ONE PAGE LINUX MANUALA summary of useful Linux commands\nVersion 3.0 May 1999 squadron@powerup.com.au\nStarting & Stopping\nshutdown -h now Shutdown the system now and do not\nreboot\nhalt Stop all processes - same as above\nshutdown -r 5 Shutdown the system in 5 minutes and\nreboot\nshutdown -r now Shutdown the system now and reboot\nreboot Stop all processes and then reboot - same\nas above\nstartx Start the X system\nAccessing & mounting file systems\nmount -t iso9660 /dev/cdrom\n/mnt/cdrom\nMount the device cdrom\nand call it cdrom under the\n/mnt directory\nmount -t msdos /dev/hdd\n/mnt/ddrive\nMount hard disk “d” as a\nmsdos file system and call\nit ddrive under the /mnt\ndirectory\nmount -t vfat /dev/hda1\n/mnt/cdrive\nMount hard disk “a” as a\nVFAT file system and call it\ncdrive under the /mnt\ndirectory\numount /mnt/cdrom Unmount the cdrom\nFinding files and text within files\nfind / -name fname Starting with the root directory, look\nfor the file called fname\nfind / -name ”*fname*” Starting with the root directory, look\nfor the file containing the string fname\nlocate missingfilename Find a file called missingfilename\nusing the locate command - this\nassumes you have already used the\ncommand updatedb (see next)\nupdatedb Create or update the database of files\non all file systems attached to the linux\nroot directory\nwhich missingfilename Show the subdirectory containing the\nexecutable file called missingfilename\ngrep textstringtofind\n/dir\nStarting with the directory called dir ,\nlook for and list all files containing\ntextstringtofind\nThe X Window System\nxvidtune Run the X graphics tuning utility\nXF86Setup Run the X configuration menu with\nautomatic probing of graphics cards\nXconfigurator Run another X configuration menu with\nautomatic probing of graphics cards\nxf86config Run a text based X configuration menu\nMoving, copying, deleting & viewing files\nls -l List files in current directory using\nlong format\nls -F List files in current directory and\nindicate the file type\nls -laC List all files in current directory in\nlong format and display in columns\nrm name Remove a file or directory called\nname\nrm -rf name Kill off an entire directory and all it’s\nincludes files and subdirectories\ncp filename\n/home/dirname\nCopy the file called filename to the\n/home/dirname directory\nmv filename\n/home/dirname\nMove the file called filename to the\n/home/dirname directory\ncat filetoview Display the file called filetoview\nman -k keyword Display man pages containing\nkeyword\nmore filetoview Display the file called filetoview one\npage at a time, proceed to next page\nusing the spacebar\nhead filetoview Display the first 10 lines of the file\ncalled filetoview\nhead -20 filetoview Display the first 20 lines of the file\ncalled filetoview\ntail filetoview Display the last 10 lines of the file\ncalled filetoview\ntail -20 filetoview Display the last 20 lines of the file\ncalled filetoview\nInstalling software for Linux\nrpm -ihv name.rpm Install the rpm package called name\nrpm -Uhv name.rpm Upgrade the rpm package called\nname\nrpm -e package Delete the rpm package called\npackage\nrpm -l package List the files in the package called\npackage\nrpm -ql package List the files and state the installed\nversion of the package called\npackage\nrpm -i --force package Reinstall the rpm package called\nname having deleted parts of it (not\ndeleting using rpm -e)\ntar -zxvf archive.tar.gz or\ntar -zxvf archive.tgz\nDecompress the files contained in\nthe zipped and tarred archive called\narchive\n./configure Execute the script preparing the\ninstalled files for compiling\nUser Administration\nadduser accountname Create a new user call accountname\npasswd accountname Give accountname a new password\nsu Log in as superuser from current login\nexit Stop being superuser and revert to\nnormal user\nLittle known tips and tricks\nifconfig List ip addresses for all devices on\nthe machine\napropos subject List manual pages for subject\nusermount Executes graphical application for\nmounting and unmounting file\nsystems', mimetype='text/plain', start_char_idx=0, end_char_idx=3986, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='f66a7433-b667-4709-a62d-852427adde72', embedding=None, metadata={'page_label': '2', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf'}, excluded_embed_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], excluded_llm_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf_part_1', node_type=<ObjectType.DOCUMENT: '4'>, metadata={'page_label': '2', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf'}, hash='9c402e8b0cfcdc404a4bedc312c2b8dc624987079092fbd856c18a639dcf294a')}, metadata_template='{key}: {value}', metadata_separator='\n', text='/sbin/e2fsck hda5 Execute the filesystem check utility\non partition hda5\nfdformat /dev/fd0H1440 Format the floppy disk in device fd0\ntar -cMf /dev/fd0 Backup the contents of the current\ndirectory and subdirectories to\nmultiple floppy disks\ntail -f /var/log/messages Display the last 10 lines of the system\nlog.\ncat /var/log/dmesg Display the file containing the boot\ntime messages - useful for locating\nproblems. Alternatively, use the\ndmesg command.\n* wildcard - represents everything. eg.\ncp from/* to will copy all files in the\nfrom directory to the to directory\n? Single character wildcard. eg.\ncp config.? /configs will copy all files\nbeginning with the name config. in\nthe current directory to the directory\nnamed configs.\n[xyz] Choice of character wildcards. eg.\nls [xyz]* will list all files in the current\ndirectory starting with the letter x, y,\nor z.\nlinux single At the lilo prompt, start in single user\nmode. This is useful if you have\nforgotten your password. Boot in\nsingle user mode, then run the\npasswd command.\nps List current processes\nkill 123 Kill a specific process eg. kill 123\nConfiguration files and what they do\n/etc/profile System wide environment variables for\nall users.\n/etc/fstab List of devices and their associated mount\npoints. Edit this file to add cdroms, DOS\npartitions and floppy drives at startup.\n/etc/motd Message of the day broadcast to all users\nat login.\netc/rc.d/rc.local Bash script that is executed at the end of\nlogin process. Similar to autoexec.bat in\nDOS.\n/etc/HOSTNAME Conatins full hostname including domain.\n/etc/cron.* There are 4 directories that automatically\nexecute all scripts within the directory at\nintervals of hour, day, week or month.\n/etc/hosts A list of all know host names and IP\naddresses on the machine.\n/etc/httpd/conf Paramters for the Apache web server\n/etc/inittab Specifies the run level that the machine\nshould boot into.\n/etc/resolv.conf Defines IP addresses of DNS servers.\n/etc/smb.conf Config file for the SAMBA server. Allows\nfile and print sharing with Microsoft\nclients.\n/etc/X11/XF86Confi\ng\nConfig file for X-Windows.\n~/.xinitrc Defines the windows manager loaded by\nX. ~ refers to user’s home directory.\nFile permissions\nIf the command ls -l is given, a long list of file names is\ndisplayed. The first column in this list details the permissions\napplying to the file. If a permission is missing for a owner,\ngroup of other, it is represented by - eg. drwxr-x—x\nRead = 4\nWrite = 2\nExecute = 1\nFile permissions are altered by giving the\nchmod command and the appropriate\noctal code for each user type. eg\nchmod 7 6 4 filename will make the file\ncalled filename R+W+X for the owner,\nR+W for the group and R for others.\nchmod 7 5 5 Full permission for the owner, read and\nexecute access for the group and others.\nchmod +x filename Make the file called filename executable\nto all users.\nX Shortcuts - (mainly for Redhat)\nControl|Alt + or - Increase or decrease the screen\nresolution. eg. from 640x480 to\n800x600\nAlt | escape Display list of active windows\nShift|Control F8 Resize the selected window\nRight click on desktop\nbackground\nDisplay menu\nShift|Control Altr Refresh the screen\nShift|Control Altx Start an xterm session\nPrinting\n/etc/rc.d/init.d/lpd start Start the print daemon\n/etc/rc.d/init.d/lpd stop Stop the print daemon\n/etc/rc.d/init.d/lpd\nstatus\nDisplay status of the print daemon\nlpq Display jobs in print queue\nlprm Remove jobs from queue\nlpr Print a file\nlpc Printer control tool\nman subject | lpr Print the manual page called subject\nas plain text\nman -t subject | lpr Print the manual page called subject\nas Postscript output\nprinttool Start X printer setup interface\n~/.Xdefaults Define configuration for some X-\napplications. ~ refers to user’s home\ndirectory.\nGet your own Official Linux Pocket Protector - includes\nhandy command summary. Visit:\nwww.powerup.com.au/~squadron', mimetype='text/plain', start_char_idx=0, end_char_idx=3881, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}')]
3.6.6.4.1.1.3. Metadata#
# Document with metadata
from llama_index.core import Document
document = Document(
text="text",
metadata={"filename": "<doc_file_name>", "category": "<category>"},
)
# Manually modify metadata
document.metadata = {"filename": "<doc_file_name>"}
# When loading from file
from llama_index.core import SimpleDirectoryReader
documents = SimpleDirectoryReader(
"./contents/theory/aiml_algorithms/dl_llm/data/",
recursive=True,
file_metadata=filename_fn,
filename_as_id=True,
).load_data()
3.6.6.4.1.1.4. Relationships#
Relationships là các liên kết giữa các Document và Node trong LlamaIndex. Chúng cho phép bạn tổ chức và truy xuất thông tin trong Document một cách hiệu quả hơn. Các mối quan hệ có thể bao gồm các liên kết giữa các Document khác nhau hoặc giữa các Node trong cùng một Document.
from llama_index.core.schema import TextNode, NodeRelationship, RelatedNodeInfo
node1 = TextNode(text="<text_chunk>", id_="<node_id>")
node2 = TextNode(text="<text_chunk>", id_="<node_id>")
# set relationships
node1.relationships[NodeRelationship.NEXT] = RelatedNodeInfo(node_id=node2.node_id)
node2.relationships[NodeRelationship.PREVIOUS] = RelatedNodeInfo(node_id=node1.node_id)
nodes = [node1, node2]
3.6.6.4.1.2. Loaders#
Data connectors ingest data from different data sources and format the data into Document objects. A Document is a collection of data (currently text
, and in future, images
and audio
) and metadata
about that data.
3.6.6.4.1.2.1. Documents trực tiếp#
Tạo Documents trực tiếp từ text
hoặc metadata
from llama_index.core import Document
doc = Document(
text="This is a sample document text",
metadata={"filename": "<doc_file_name>", "category": "<category>"},
)
doc
Document(id_='f884e9c4-11b9-40a9-b0b9-6a31cae2333b', embedding=None, metadata={'filename': '<doc_file_name>', 'category': '<category>'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={}, metadata_template='{key}: {value}', metadata_separator='\n', text_resource=MediaResource(embeddings=None, data=None, text='This is a sample document text', path=None, url=None, mimetype=None), image_resource=None, audio_resource=None, video_resource=None, text_template='{metadata_str}\n\n{content}')
3.6.6.4.1.2.2. SimpleDirectoryReader#
SimpleDirectoryReader: Tạo Documents từ một folder/file
The easiest reader which creates documents
out of every file in a given directory. It is built in to LlamaIndex and can read a variety of formats including Markdown
, PDFs
, Word documents
, PowerPoint decks
, images
, audio
and video
.
from llama_index.core import SimpleDirectoryReader
def filename_fn(filename):
return {"file_name": filename}
documents = SimpleDirectoryReader(
"./contents/theory/aiml_algorithms/dl_llm/data/",
recursive=True,
file_metadata=filename_fn,
filename_as_id=True,
).load_data()
print(documents[0].get_content())
We may be known as the Great White North, but we’re also green and blue! Did you know Canada
has more lakes than the rest of the world combined and is home to 10% of the world’s forests?
Some of its national parks are bigger than entire countries!
Wild about wildlife: Canada is home to 2.4 million caribou and 15,500 of the world’s 25,000 polar
bears, not to mention home to 22 different species of whales.
Canada’s Great Trail, a network of trails stretching across the country from coast-to-coast-to-coast,
is the longest recreational trail in the world. At 24,000km of land- and water-based trail, it’s longer
than the Great Wall of China (8,851km).
Canada is made for outdoor adventurers. Did you know you can raft-surf the world’s highest tides
at the Bay of Fundy, paddle with orcas in British Columbia, track the largest caribou migration in
Nunavut or kayak past icebergs and humpback whales in Newfoundland and Labrador?
Canada is known as a diverse nation that’s welcoming to immigrants. In 2016, over 250 ethnic
ancestries were reported by the Canadian population, contributing to a rich and vibrant culture and
culinary scene.
Well-educated: More than half of Canadians have earned college degrees, making it the world’s
most educated nation.
Canada is home to North America’s only remaining walled city—the historic neighbourhood of
Old Quebec, also the first city in North America to be placed on UNESCO’s World Heritage Sites list.
Canada has the world’s most northern settlement: Alert, Nunavut, just shy of the North Pole. That’s
why Santa has his own Canada Post postal code here, (H0H 0H0), where kids can send him letters
at Christmas (he responds).
Can you guess Canada’s most played sport? Perhaps a bit surprising, it’s golf, followed by the
beloved national pastime, ice hockey.
Fun Facts About Canada
documents[0].metadata
{'page_label': '1',
'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\MediaCentre-FunFacts_EN_1.pdf'}
3.6.6.4.1.2.3. LlamaParse#
LlamaParse là LlamaIndex’s official tool for PDF parsing, available as a managed API.
See llamaparse for more details.
Need for Advanced Parsing:
Complex file formats may contain mixed content (e.g., text, images, charts).
Basic readers may struggle with accurate extraction.
LlamaParse Features:
Leverages LLM intelligence for superior document parsing.
Supports a variety of formats beyond PDFs, including Word, PowerPoint, and RTF.
Allows instructions for tailored parsing outcomes using the
parsing_instruction
parameter
%pip install -qU llama-cloud-services llama-index-core llama-index-readers-file python-dotenv
Note: you may need to restart the kernel to use updated packages.
from dotenv import load_dotenv
from llama_cloud_services import LlamaParse
from llama_index.core import SimpleDirectoryReader
import nest_asyncio
nest_asyncio.apply()
load_dotenv("contents/theory/aiml_algorithms/dl_llm/.env")
# set up parser
parser = LlamaParse(
result_type="markdown" # "markdown" and "text" are available
)
# use SimpleDirectoryReader to parse our file
file_extractor = {".pdf": parser}
documents = SimpleDirectoryReader(
input_files=[
r"contents\theory\aiml_algorithms\dl_llm\data\MediaCentre-FunFacts_EN_1.pdf"
],
file_extractor=file_extractor,
).load_data()
print(documents)
Started parsing the file under job_id 0684932f-38ff-4f36-a74e-a2f9642ee17f
[Document(id_='c68c19f7-a558-4072-ba26-f6b5683d43ab', embedding=None, metadata={'file_path': 'contents\\theory\\aiml_algorithms\\dl_llm\\data\\MediaCentre-FunFacts_EN_1.pdf', 'file_name': 'MediaCentre-FunFacts_EN_1.pdf', 'file_type': 'application/pdf', 'file_size': 335061, 'creation_date': '2025-04-11', 'last_modified_date': '2025-04-11'}, excluded_embed_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], excluded_llm_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], relationships={}, metadata_template='{key}: {value}', metadata_separator='\n', text_resource=MediaResource(embeddings=None, data=None, text='# Fun Facts About Canada\n\nWe may be known as the Great White North, but we’re also green and blue! Did you know Canada has more lakes than the rest of the world combined and is home to 10% of the world’s forests? Some of its national parks are bigger than entire countries!\n\nWild about wildlife: Canada is home to 2.4 million caribou and 15,500 of the world’s 25,000 polar bears, not to mention home to 22 different species of whales.\n\nCanada’s Great Trail, a network of trails stretching across the country from coast-to-coast-to-coast, is the longest recreational trail in the world. At 24,000km of land- and water-based trail, it’s longer than the Great Wall of China (8,851km).\n\nCanada is made for outdoor adventurers. Did you know you can raft-surf the world’s highest tides at the Bay of Fundy, paddle with orcas in British Columbia, track the largest caribou migration in Nunavut or kayak past icebergs and humpback whales in Newfoundland and Labrador?\n\nCanada is known as a diverse nation that’s welcoming to immigrants. In 2016, over 250 ethnic ancestries were reported by the Canadian population, contributing to a rich and vibrant culture and culinary scene.\n\nWell-educated: More than half of Canadians have earned college degrees, making it the world’s most educated nation.\n\nCanada is home to North America’s only remaining walled city—the historic neighbourhood of Old Quebec, also the first city in North America to be placed on UNESCO’s World Heritage Sites list.\n\nCanada has the world’s most northern settlement: Alert, Nunavut, just shy of the North Pole. That’s why Santa has his own Canada Post postal code here, (H0H 0H0), where kids can send him letters at Christmas (he responds).\n\nCan you guess Canada’s most played sport? Perhaps a bit surprising, it’s golf, followed by the beloved national pastime, ice hockey.', path=None, url=None, mimetype=None), image_resource=None, audio_resource=None, video_resource=None, text_template='{metadata_str}\n\n{content}'), Document(id_='e76821fb-11fc-47b8-ac9d-4fa54790722c', embedding=None, metadata={'file_path': 'contents\\theory\\aiml_algorithms\\dl_llm\\data\\MediaCentre-FunFacts_EN_1.pdf', 'file_name': 'MediaCentre-FunFacts_EN_1.pdf', 'file_type': 'application/pdf', 'file_size': 335061, 'creation_date': '2025-04-11', 'last_modified_date': '2025-04-11'}, excluded_embed_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], excluded_llm_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], relationships={}, metadata_template='{key}: {value}', metadata_separator='\n', text_resource=MediaResource(embeddings=None, data=None, text='Canada produces 70% of the world’s maple syrup — and nearly all of it comes from Quebec maples.\n\nCanadians love their poutine, but are crazy about decadent dough rings! Canada has the most doughnut shops per capita in the world and its people consume the most doughnuts of anywhere else in the world.\n\nOttawa, Canada’s capital region, houses the country’s most precious cultural treasures. Eight of Canada’s nine national museums and galleries are located here. The ninth is the Canadian Museum for Human Rights in Winnipeg, Manitoba.\n\nCanada is home to the longest running ballet company in North America – the internationally renowned Royal Winnipeg Ballet in Manitoba is the oldest ballet company in Canada.\n\nCanada is the number 1 travel destination in the world, according to Travel + Leisure magazine (2017) (and Lonely Planet), singled out for its unspoiled landscapes, dynamic cities, cultural institutions and welcoming spirit.\n\nkeepexploring.ca', path=None, url=None, mimetype=None), image_resource=None, audio_resource=None, video_resource=None, text_template='{metadata_str}\n\n{content}')]
3.6.6.4.1.2.4. LlamaHub#
LlamaHub: Tạo Documents từ các nguồn dữ liệu bên ngoài như Google Drive
, Notion
, Github
, Google Search
, Wikipedia
, Web pages
, Database
và more.
WikiReader: Tạo Documents từ Wikipedia
%pip install -qU llama-index-readers-wikipedia wikipedia
from llama_index.readers.wikipedia import WikipediaReader
loader = WikipediaReader()
documents = loader.load_data(pages=["Pythagorean theorem", "General relativity"])
print(f"loaded {len(documents)} documents")
Note: you may need to restart the kernel to use updated packages.
loaded 2 documents
WebReader: Tạo Documents từ Web pages
%pip install -qU llama-index-readers-web
Note: you may need to restart the kernel to use updated packages.
from llama_index.readers.web import BeautifulSoupWebReader
loader = BeautifulSoupWebReader()
documents = loader.load_data(
urls=[
"https://pinetree.vn/post/dich-vu/mo-tai-khoan-chung-khoan-khach-hang-ca-nhan/",
]
)
print(f"loaded {len(documents)} documents")
loaded 1 documents
DatabaseReader: Tạo Documents từ Database
%pip install -qU llama-index-readers-database
Note: you may need to restart the kernel to use updated packages.
from llama_index.core.schema import Document
from llama_index.readers.database import DatabaseReader
# Initialize DatabaseReader with the SQL database connection details
reader = DatabaseReader(
sql_database="<SQLDatabase Object>", # Optional: SQLDatabase object
engine="<SQLAlchemy Engine Object>", # Optional: SQLAlchemy Engine object
uri="<Connection URI>", # Optional: Connection URI
scheme="<Scheme>", # Optional: Scheme
host="<Host>", # Optional: Host
port="<Port>", # Optional: Port
user="<Username>", # Optional: Username
password="<Password>", # Optional: Password
dbname="<Database Name>", # Optional: Database Name
)
# Load data from the database using a query
documents = reader.load_data(
query="<SQL Query>" # SQL query parameter to filter tables and rows
)
3.6.6.4.1.3. Chunking - Node parser#
Chunking: Chia nhỏ dữ liệu thành các phần tử nhỏ hơn (nodes) để dễ dàng xử lý và truy xuất thông tin. Điều này có thể bao gồm việc chia nhỏ văn bản thành các đoạn văn bản ngắn hơn hoặc chia nhỏ tệp tin thành các phần tử nhỏ hơn.
When a document is broken into nodes, all of it’s attributes are inherited to the children nodes (i.e. metadata, text and metadata templates, etc.)
Nodes có thể được tạo thông qua:
Sử dụng Node parsers trực tiếp với Document
Sử dụng Node parsers trong set of transformations với Ingestion Pipeline
Sử dụng Node parsers trong set of transformations với Indexing Function (
.from_documents()
)
3.6.6.4.1.3.1. File-Based Node Parsers#
Parse nội dung của các tệp tin thành các nodes tuỳ theo định dạng của tệp tin.
SimpleFileNodeParser
: automatically use the best node parser for each type of content
!wget -O data/README.md https://raw.githubusercontent.com/py-pdf/sample-files/main/README.md
--2025-04-12 17:09:47-- https://raw.githubusercontent.com/py-pdf/sample-files/main/README.md
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 2606:50c0:8003::154, 2606:50c0:8002::154, 2606:50c0:8000::154, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|2606:50c0:8003::154|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 420 [text/plain]
Saving to: ‘data/README.md’
data/README.md 100%[===================>] 420 --.-KB/s in 0s
2025-04-12 17:09:47 (66.8 MB/s) - ‘data/README.md’ saved [420/420]
from llama_index.core.node_parser import SimpleFileNodeParser
from llama_index.readers.file import FlatReader
from pathlib import Path
md_docs = FlatReader().load_data(Path("data/README.md"))
parser = SimpleFileNodeParser()
md_nodes = parser.get_nodes_from_documents(md_docs)
md_nodes
[TextNode(id_='93391c60-ea11-46f7-a29e-3de205d6bae0', embedding=None, metadata={'filename': 'README.md', 'extension': '.md', 'header_path': '/'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='55e60977-1e1d-4f99-acf6-f06ffe59b12b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={'filename': 'README.md', 'extension': '.md'}, hash='feaa6345809fa80a2cf5f084d79254aa94d2005fe4b8b6b06e95140913bb8348'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='1e42ac0e-9dd0-4c91-8a34-3330cf7037e3', node_type=<ObjectType.TEXT: '1'>, metadata={'filename': 'README.md', 'extension': '.md', 'header_path': '/PDF Sample Files/'}, hash='8caf29cccb16822123226cf7545c57d666333db6cba80a36844d5345d8d7a1f8')}, metadata_template='{key}: {value}', metadata_separator='\n', text='# PDF Sample Files\n\nThis repository provides files for testing software that reads / parses\nPDF files.\n\nThe `files.json` file contains a list of those PDF files with their metadata.', mimetype='text/plain', start_char_idx=0, end_char_idx=181, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='1e42ac0e-9dd0-4c91-8a34-3330cf7037e3', embedding=None, metadata={'filename': 'README.md', 'extension': '.md', 'header_path': '/PDF Sample Files/'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='55e60977-1e1d-4f99-acf6-f06ffe59b12b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={'filename': 'README.md', 'extension': '.md'}, hash='feaa6345809fa80a2cf5f084d79254aa94d2005fe4b8b6b06e95140913bb8348'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='93391c60-ea11-46f7-a29e-3de205d6bae0', node_type=<ObjectType.TEXT: '1'>, metadata={'filename': 'README.md', 'extension': '.md', 'header_path': '/'}, hash='6781beeb918ba1b626d97f00b5defba32de7b20b44676e80ed652943cfab50ce'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='852e389c-161f-49c7-8fef-b6e03655c90a', node_type=<ObjectType.TEXT: '1'>, metadata={'filename': 'README.md', 'extension': '.md', 'header_path': '/PDF Sample Files/'}, hash='ebe0983178421458b261bd5c89e7a2840c9a05ec0f4231f0c522cf77f0555bb9')}, metadata_template='{key}: {value}', metadata_separator='\n', text='## Licenses\n\nEvery PDF in this repository is under the Creative Commons\nAttribution-ShareAlike License (CC-BY-SA-4.0).', mimetype='text/plain', start_char_idx=183, end_char_idx=301, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='852e389c-161f-49c7-8fef-b6e03655c90a', embedding=None, metadata={'filename': 'README.md', 'extension': '.md', 'header_path': '/PDF Sample Files/'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='55e60977-1e1d-4f99-acf6-f06ffe59b12b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={'filename': 'README.md', 'extension': '.md'}, hash='feaa6345809fa80a2cf5f084d79254aa94d2005fe4b8b6b06e95140913bb8348'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='1e42ac0e-9dd0-4c91-8a34-3330cf7037e3', node_type=<ObjectType.TEXT: '1'>, metadata={'filename': 'README.md', 'extension': '.md', 'header_path': '/PDF Sample Files/'}, hash='8caf29cccb16822123226cf7545c57d666333db6cba80a36844d5345d8d7a1f8')}, metadata_template='{key}: {value}', metadata_separator='\n', text='## Contributions\n\nPlease contribute files to fill this repository! Just create a PR with a\nPDF file created by you.', mimetype='text/plain', start_char_idx=304, end_char_idx=419, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}')]
HTMLNodeParser
: usesbeautifulsoup
to parse raw HTML by a select subset of HTML tags (default:["p", "h1", "h2", "h3", "h4", "h5", "h6", "li", "b", "i", "u", "section"]
)
from llama_index.core.node_parser import HTMLNodeParser
from llama_index.readers.web import BeautifulSoupWebReader
import requests
from llama_index.core import Document
# Fetch HTML content from a URL
url = "https://pinetree.vn/post/dich-vu/mo-tai-khoan-chung-khoan-khach-hang-ca-nhan/"
response = requests.get(url)
if response.status_code == 200:
html_docs = [Document(text=response.text)]
else:
raise Exception(f"Failed to fetch the URL: {url}")
# Parse HTML documents
parser = HTMLNodeParser(
# tags=["p", "h1"] # optional list of tags
)
nodes = parser.get_nodes_from_documents(html_docs)
nodes
[TextNode(id_='e4b1a808-6241-44d6-abfc-e5cdf9b124b8', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='3aa30a48-659a-4184-9293-2aadd65b51ca', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'i'}, hash='670fa8a9d1bc2a07f6268f58dfbe014d893b39e621ac84ef2ec9d2034786cd31')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Dịch vụ và nền tảng\nDịch vụCổ phiếu\nTrái phiếu\nPineFolio\nPhái sinh\nTư vấn tài chính doanh nghiệp\nChương trình phát triển Khách hàng\n\n\nNền tảng giao dịchAlphaTrading\nWebTrading\nPineX\nStock123\nMobile Webview\nEliteTrade\nDịch vụ\nCổ phiếu\nTrái phiếu\nPineFolio\nPhái sinh\nTư vấn tài chính doanh nghiệp\nChương trình phát triển Khách hàng\nCổ phiếu\nTrái phiếu\nPineFolio\nPhái sinh\nTư vấn tài chính doanh nghiệp\nChương trình phát triển Khách hàng\nNền tảng giao dịch\nAlphaTrading\nWebTrading\nPineX\nStock123\nMobile Webview\nEliteTrade\nAlphaTrading\nWebTrading\nPineX\nStock123\nMobile Webview\nEliteTrade\nKiến thức\nDigital knowledge center\nCập nhật thị trường\nKiến thức cơ bản\nGiao dịch ký quỹ\nGiao dịch phái sinh\nDigital knowledge center\nCập nhật thị trường\nKiến thức cơ bản\nGiao dịch ký quỹ\nGiao dịch phái sinh\nVề chúng tôi\nGiới thiệu\nTin tức\nCơ hội nghề nghiệp\nGiới thiệu\nTin tức\nCơ hội nghề nghiệp', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='3aa30a48-659a-4184-9293-2aadd65b51ca', embedding=None, metadata={'tag': 'i'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='e4b1a808-6241-44d6-abfc-e5cdf9b124b8', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='f186f77ce158b7fdfa6a54a8e8f3024734c828a5b17efc25730395ef24de6b5d'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='a1599b03-8cc3-4f27-a89e-47d99b4c9c15', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='816021f6e77796e5bfd6eba9cef673fc45e61cb49a0e9c65fccee0440f819572')}, metadata_template='{key}: {value}', metadata_separator='\n', text='', mimetype='text/plain', start_char_idx=0, end_char_idx=0, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='a1599b03-8cc3-4f27-a89e-47d99b4c9c15', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='3aa30a48-659a-4184-9293-2aadd65b51ca', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'i'}, hash='670fa8a9d1bc2a07f6268f58dfbe014d893b39e621ac84ef2ec9d2034786cd31'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='fdba5ffb-b9ca-4bc2-ba69-4c27ebcbb7bc', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'section'}, hash='54214d8f091ab0d0d937445d5979645c8007351150e6ec7aaecb7552c039e7cc')}, metadata_template='{key}: {value}', metadata_separator='\n', text='English\nHỗ trợ\nGIAO DỊCH NGAY\nMỞ TÀI KHOẢN\n\nDịch vụ và nền tảng\nDịch vụ\n\nCổ phiếu\nTrái phiếu\nPineFolio\nPhái sinh\nTư vấn tài chính doanh nghiệp\n\n\nNền tảng giao dịch\n\nAlphaTrading\nWeb trading\nPineX\nStock123\nDịch vụ\nCổ phiếu\nTrái phiếu\nPineFolio\nPhái sinh\nTư vấn tài chính doanh nghiệp\nCổ phiếu\nTrái phiếu\nPineFolio\nPhái sinh\nTư vấn tài chính doanh nghiệp\nNền tảng giao dịch\nAlphaTrading\nWeb trading\nPineX\nStock123\nAlphaTrading\nWeb trading\nPineX\nStock123\nHỗ trợ khách hàng\nSẵn sàng gia nhập Pinetree\nĐầu tư\nGiao dịch tiền\nHướng dẫn sử dụng\nLưu ký chứng khoán\nFAQ\nSẵn sàng gia nhập Pinetree\nĐầu tư\nGiao dịch tiền\nHướng dẫn sử dụng\nLưu ký chứng khoán\nFAQ\nKiến thức\nDigital knowledge center\nCập nhật thị trường\nKiến thức cơ bản\nGiao dịch ký quỹ\nDigital knowledge center\nCập nhật thị trường\nKiến thức cơ bản\nGiao dịch ký quỹ\nPinetree\nGiới thiệu\nQuan hệ nhà đầu tư\nTin tức\nCơ hội nghề nghiệp\nLiên hệ\nGiới thiệu\nQuan hệ nhà đầu tư\nTin tức\nCơ hội nghề nghiệp\nLiên hệ\nHỗ trợ\nGIAO DỊCH NGAY\nMỞ TÀI KHOẢN\nEnglish', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='fdba5ffb-b9ca-4bc2-ba69-4c27ebcbb7bc', embedding=None, metadata={'tag': 'section'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='a1599b03-8cc3-4f27-a89e-47d99b4c9c15', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='816021f6e77796e5bfd6eba9cef673fc45e61cb49a0e9c65fccee0440f819572'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='3c978655-f536-4db0-bc1d-954d0687d90c', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h1'}, hash='2ce3bd40b194e28c0aa37290db6b9a68a45636cccffa23bd9f3a50df1aae90bf')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Hỗ trợ khách hàng \n\n\n\n\n\r\n Mở tài khoản chứng khoán dành cho khách hàng cá nhân', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='3c978655-f536-4db0-bc1d-954d0687d90c', embedding=None, metadata={'tag': 'h1'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='fdba5ffb-b9ca-4bc2-ba69-4c27ebcbb7bc', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'section'}, hash='54214d8f091ab0d0d937445d5979645c8007351150e6ec7aaecb7552c039e7cc'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='3b3163a9-0ed2-4756-840a-5d3995016540', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'section'}, hash='d2a1e3356e00aed10cf91cd3746d25004a0ed80c23f569d851ba4724445fadfe')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Mở tài khoản chứng khoán dành cho khách hàng cá nhân', mimetype='text/plain', start_char_idx=43143, end_char_idx=43195, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='3b3163a9-0ed2-4756-840a-5d3995016540', embedding=None, metadata={'tag': 'section'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='3c978655-f536-4db0-bc1d-954d0687d90c', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h1'}, hash='2ce3bd40b194e28c0aa37290db6b9a68a45636cccffa23bd9f3a50df1aae90bf'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='06ee78fa-5f24-4e0e-bc2c-2775531502ab', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='e1fe56db4bab6f97c717e7245b95b4dba2ef884c4d76996ab15573e9abed4742')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Sẵn sàng gia nhập Pinetree Mở tài khoản chứng khoánMở tài khoản chứng khoán dành cho khách hàng cá nhân\nKhách hàng tổ chức\nDịch vụ liên kết tài khoản ngân hàng\n\n\nBiểu mẫu chứng từHướng dẫn hoàn thiện hợp đồng (KH cá nhân)\nKhách hàng tổ chức\n\n\nChính sách phí\nCập nhật thông tin\nXác thực tài khoản\n\n\nĐầu tư Cổ phiếuCác loại lệnh chứng khoán\nQuy tắc giao dịch\n\n\nỨng trước tiền bán chứng khoánDịch vụ ứng trước tiền bán chứng khoán\nCách đăng ký dịch vụ ứng trước tiền bán chứng khoán\nHướng dẫn\n\n\nGiao dịch ký quỹCách đăng ký giao dịch ký quỹ\nDanh mục ký quỹ\nHướng dẫn giao dịch ký quỹ\n\n\nLệnh điều kiện cơ sởLệnh trước ngày\nLệnh xu hướng\nLệnh chốt lời\nLệnh cắt lỗ\nLệnh tranh mua tranh bán\nQuản lý lệnh điều kiện\n\n\nPhái sinhKhái niệm và Quy tắc giao dịch\nQuy trình giao dịch CKPS tại Pinetree\nChính sách sản phẩm CKPS tại Pinetree\nHướng dẫn sử dụng Lệnh điều kiện CKPS - WebTrading\nHướng dẫn sử dụng Lệnh điều kiện CKPS - AlphaTrading\nFAQ Lệnh điều kiện CKPS\nT&C - Lệnh Điều kiện trong giao dịch CKPS\n\n\nHướng dẫn Giao dịch Trái phiếu Doanh nghiệp riêng lẻ\nHướng dẫn giao dịch công cụ nợ\n\n\nGiao dịch tiền Nộp tiền vào tài khoản\nRút tiền từ tài khoản\nHướng dẫn đính chính, tra soát\n\n\nHướng dẫn sử dụng AlphaTradingThông tin chung\nHướng dẫn đặt lệnh\nSử dụng AlphaTrading\nTài khoản chứng khoán\n\n\nPineXThông tin chung\nTham gia mạng xã hội PineX\nKhám phá PineX\nSử dụng PineX\nQuà tặng\nHướng dẫn đặt lệnh\nTiện ích tài chính\n\n\nWebTrading\nWebview (Nam A Bank)\nHướng dẫn sử dụng Phương thức xác thực\n\n\nLưu ký chứng khoán Lưu ký chứng khoán/ Rút lưu ký chứng khoán\nThực hiện quyền mua – Chuyển nhượng quyền mua\nChuyển khoản chứng khoán\nGiao dịch chứng khoán lô lẻ\nChuyển chủ sở hữu chứng khoán\nThừa kế chứng khoán\n\n\nChính sách Trái phiếu PineB\nHướng dẫn công bố thông tin Hướng dẫn công bố thông tin của cổ đông lớn\nHướng dẫn công bố thông tin của người nội bộ và người liên quan\n\n\nFAQ Mở/Đóng tài khoản\nGiao dịch tiền\nDịch vụ tài chính - Margin\nTrái phiếu\nPinefolio\nPhái sinh\nDịch vụ chứng khoán\nThông tin khách hàng/Xác thực\n\n\nBản công bố rủi ro\nChính sách xử lý dữ liệu cá nhân\nXác nhận nhà đầu tư chuyên nghiệp\nChương trình phát triển khách hàng Điều khoản và điều kiện\nHướng dẫn đăng ký\n\n\nLiên hệ\n\n\n\n\n\n\nMở tài khoản chứng khoán\nMở tài khoản chứng khoán dành cho khách hàng cá nhân\n\n\nMở tài khoản chứng khoán tại Pinetree chưa bao giờ dễ dàng đến thế. Quý khách chỉ cần\xa02 phút\xa0để đăng ký và có thể giao dịch ngay sau khi tạo tài khoản online thành công.\nCông ty chứng khoán duy nhất MIỄN PHÍ GIAO DỊCH TRỌN ĐỜI! Lãi suất Margin chỉ 9.9%/ năm không kèm theo điều kiện.\nCác cách mở tài khoản chứng khoán tại Pinetree:\nCÁCH 1: MỞ TÀI KHOẢN TẠI QUẦY\nQuý khách vui lòng mang theo CMND hoặc CCCD còn hiệu lực theo quy định đến trực tiếp tại trụ sở của Pinetree theo địa chỉ như sau: Phòng\xa0Dịch\xa0vụ\xa0Khách hàng\nCông ty Cổ phần Chứng khoán Pinetree\nĐịa chỉ: Tầng 20, Tòa nhà ROX Tower, 54A Nguyễn Chí Thanh, Láng Thượng, Đống Đa, Hà NộiChuyên viên Pinetree sẽ hỗ trợ và hướng dẫn Quý khách đăng ký mở tài khoản tại quầy. \nCÁCH 2: MỞ TÀI KHOẢN E-KYC – TÀI KHOẢN ĐƯỢC ACTIVE GIAO DỊCH NGAY TRONG NGÀY\nBước 1:\xa0Quý khách truy cập App store/ CH play, tải về 1 trong 2 ứng dụng Alphatrading hoặc PineX.\nBước 2:\xa0Chuẩn bị chứng minh thư bản gốc.\nBước 3:\xa0Thực hiện theo hướng dẫn\xa0tại đây.\nCÁCH 3: MỞ TÀI KHOẢN TẠI WEBSITE\xa0– Mất 3-4 ngày để hoàn tất hồ sơ\nBước 1:\xa0Quý khách truy cập vào website của Công ty Cổ phần Chứng khoán Pinetree theo đường dẫn sau: https://pinetree.vn/\nBước 2:\xa0Nhấp chuột vào “MỞ TÀI KHOẢN” như hình dưới:\n\nBước 3:\xa0Sau khi chọn “MỞ TÀI KHOẢN”, Quý khách sẽ được chuyển đến trang điền thông tin mở tài khoản. Quý khách vui lòng điền thông tin đầy đủ và chính xác theo hướng dẫn.\nLưu ý:\nSố điện thoại: Số điện thoại dùng để xác thực tạo tài khoản chứng khoán, xác thực giao dịch và liên hệ với Pinetree.Thông tin cá nhân:\nHọ và tên: Quý khách vui lòng nhập thông tin đầy đủ họ và tên và viết có dấu như trong thông tin ghi trên CMND/CCCD.\nEmail: Hòm thư dùng để xác thực mở tài khoản, nhận thông tin từ Pinetree.\nGiới tính: Quý khách tích chọn Nam hoặc Nữ\nNgày sinh: Thông tin trùng khớp với thông tin trong CMT hoặc Thẻ căn cước.\nThông tin CMT/Thẻ căn Cước: Thông tin số CMT/Thẻ căn cước, ngày cấp và nơi cấp\nThông tin địa chỉ: Quý khách ghi đầy đủ Địa chỉ thường trú và Địa chỉ liên lạc bao gồm: Số nhà, Phường/Xã, Quận/Huyện, Tỉnh/Thành Phố.\nThông tin ngân hàng: Quý khách vui lòng điền thông tin ngân hàng mà Quý khách đang sử dụng để sau này thực hiện chuyển tiền từ tài khoản chứng khoán ra ngoài.\n(Trong trường hợp chưa có tài khoản ngân hàng, Quý khách có thể bỏ qua và bổ sung thêm tài khoản sau khi Đăng ký mở tài khoản thành công)\nBước 4:\xa0Pinetree thông báo tạo tài khoản chứng khoán thành công:\nQuý khách vui lòng kiểm tra Email hoặc tin nhắn điện thoại đã đăng ký khi mở tài khoản để biết thông tin Số tài khoản, thông tin đăng nhập tài khoản chứng khoán và trải nghiệm hệ sinh thái của Pinetree.\nBước 5: Quý khách hàng hoàn thiện hợp đồng mở tài khoản để kích hoạt đầy đủ các dịch vụ tiện ích.\n(Hướng dẫn chi tiết trong mục HƯỚNG DẪN HOÀN THIỆN HỢP ĐỒNG MỞ TK TẠI PINETREE).\n\nLưu ý: Việc đăng ký mở tài khoản và hoàn thiện hồ sơ cần được thực hiện bởi chính chủ tài khoản. \n\n\n\nBạn cần trợ giúp thêm? Liên hệ với chúng tôi\n\n\nBạn có tìm được thông tin hữu ích không?\n\n\n\n\n2\n\n\n\n\n1', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='06ee78fa-5f24-4e0e-bc2c-2775531502ab', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='3b3163a9-0ed2-4756-840a-5d3995016540', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'section'}, hash='d2a1e3356e00aed10cf91cd3746d25004a0ed80c23f569d851ba4724445fadfe'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='82ba8808-6ed8-4b7b-83d1-f849a3800951', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='bd50549c4fb851a96bf2f31318d79b93e6ea5a5ac82f151fbc45fa4fef16fecf')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Sẵn sàng gia nhập Pinetree\nMở tài khoản chứng khoánMở tài khoản chứng khoán dành cho khách hàng cá nhân\nKhách hàng tổ chức\nDịch vụ liên kết tài khoản ngân hàng\n\n\nBiểu mẫu chứng từHướng dẫn hoàn thiện hợp đồng (KH cá nhân)\nKhách hàng tổ chức\n\n\nChính sách phí\nCập nhật thông tin\nXác thực tài khoản\nMở tài khoản chứng khoán\nMở tài khoản chứng khoán dành cho khách hàng cá nhân\nKhách hàng tổ chức\nDịch vụ liên kết tài khoản ngân hàng', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='82ba8808-6ed8-4b7b-83d1-f849a3800951', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='06ee78fa-5f24-4e0e-bc2c-2775531502ab', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='e1fe56db4bab6f97c717e7245b95b4dba2ef884c4d76996ab15573e9abed4742'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='01224441-d9c0-48a6-b366-2e2fe3a79ea7', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='389493c39b995c8734514cae0d30a24daf8bb91e8baab39b3f4411129719efe0')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Mở tài khoản chứng khoán', mimetype='text/plain', start_char_idx=9014, end_char_idx=9038, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='01224441-d9c0-48a6-b366-2e2fe3a79ea7', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='82ba8808-6ed8-4b7b-83d1-f849a3800951', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='bd50549c4fb851a96bf2f31318d79b93e6ea5a5ac82f151fbc45fa4fef16fecf'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='9076fa9f-7a07-44a1-b584-03cbdfc82789', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='6a5a2e9258b54b0f794505b19499c0df1a24a8afa9949270a063f71e4ea439e0')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Mở tài khoản chứng khoán dành cho khách hàng cá nhân\nKhách hàng tổ chức\nDịch vụ liên kết tài khoản ngân hàng\nBiểu mẫu chứng từ\nHướng dẫn hoàn thiện hợp đồng (KH cá nhân)\nKhách hàng tổ chức', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='9076fa9f-7a07-44a1-b584-03cbdfc82789', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='01224441-d9c0-48a6-b366-2e2fe3a79ea7', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='389493c39b995c8734514cae0d30a24daf8bb91e8baab39b3f4411129719efe0'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='30bc0bae-c8ac-4052-ae3a-4752447eb880', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='9850476bb9a4772847f61292b17848ec89f04bb7e1a8561806fd1567ce9a6c76')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Biểu mẫu chứng từ', mimetype='text/plain', start_char_idx=45010, end_char_idx=45027, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='30bc0bae-c8ac-4052-ae3a-4752447eb880', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='9076fa9f-7a07-44a1-b584-03cbdfc82789', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='6a5a2e9258b54b0f794505b19499c0df1a24a8afa9949270a063f71e4ea439e0'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='bd6da126-9379-4b7a-a7c2-7321fdb7c4ea', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='eef9ee57e48b6bc785c89108cd18d7192676d736996e5136aa548334afe09b7b')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Hướng dẫn hoàn thiện hợp đồng (KH cá nhân)\nKhách hàng tổ chức\nChính sách phí', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='bd6da126-9379-4b7a-a7c2-7321fdb7c4ea', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='30bc0bae-c8ac-4052-ae3a-4752447eb880', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='9850476bb9a4772847f61292b17848ec89f04bb7e1a8561806fd1567ce9a6c76'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='dcf1b4d0-7d08-4b8e-8fdd-d878fe8e5def', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='18044f1ba4a43705b7a14eed08ff21adf5fb5daea767691920a932e3d3306189')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Chính sách phí', mimetype='text/plain', start_char_idx=45568, end_char_idx=45582, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='dcf1b4d0-7d08-4b8e-8fdd-d878fe8e5def', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='bd6da126-9379-4b7a-a7c2-7321fdb7c4ea', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='eef9ee57e48b6bc785c89108cd18d7192676d736996e5136aa548334afe09b7b'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='e6308aea-eaae-4537-8ca5-624a7d442258', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='38e741bbc3b6a18ed189189d02c22a79ac0077e87c830948fa4c4b22e1376bef')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Cập nhật thông tin', mimetype='text/plain', start_char_idx=45740, end_char_idx=45758, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='e6308aea-eaae-4537-8ca5-624a7d442258', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='dcf1b4d0-7d08-4b8e-8fdd-d878fe8e5def', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='18044f1ba4a43705b7a14eed08ff21adf5fb5daea767691920a932e3d3306189'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='ce7203aa-dce4-4095-aef8-e6b906ce9fed', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='67cd61d939b6ac09817b8748ce50492ee9fba8a624bc5f6caaa5f8936442ee64')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Cập nhật thông tin', mimetype='text/plain', start_char_idx=45740, end_char_idx=45758, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='ce7203aa-dce4-4095-aef8-e6b906ce9fed', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='e6308aea-eaae-4537-8ca5-624a7d442258', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='38e741bbc3b6a18ed189189d02c22a79ac0077e87c830948fa4c4b22e1376bef'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='6d26eb06-0a95-40a5-9086-d7b761d9bcb7', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='6dbf34e257004757f9244793d4c2e2dfb535cc5cc24eb9e4d0e86dba546a1821')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Xác thực tài khoản', mimetype='text/plain', start_char_idx=45916, end_char_idx=45934, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='6d26eb06-0a95-40a5-9086-d7b761d9bcb7', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='ce7203aa-dce4-4095-aef8-e6b906ce9fed', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='67cd61d939b6ac09817b8748ce50492ee9fba8a624bc5f6caaa5f8936442ee64'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='0e9b3e8c-c0d6-43b4-9edd-031d29b4e204', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='8c7c3d8bf6c797306a4344285c19525f6c6f737bb49ec85ac4cfe6b996a4563d')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Xác thực tài khoản', mimetype='text/plain', start_char_idx=45916, end_char_idx=45934, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='0e9b3e8c-c0d6-43b4-9edd-031d29b4e204', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='6d26eb06-0a95-40a5-9086-d7b761d9bcb7', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='6dbf34e257004757f9244793d4c2e2dfb535cc5cc24eb9e4d0e86dba546a1821'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='544041d1-e75b-421b-a651-edea6c5a29be', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='f58ff75e7302ef6f3da4aaced9f8e77d7558caf69dbdc3d3e35195c1703ce398')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Đầu tư\nCổ phiếuCác loại lệnh chứng khoán\nQuy tắc giao dịch\n\n\nỨng trước tiền bán chứng khoánDịch vụ ứng trước tiền bán chứng khoán\nCách đăng ký dịch vụ ứng trước tiền bán chứng khoán\nHướng dẫn\n\n\nGiao dịch ký quỹCách đăng ký giao dịch ký quỹ\nDanh mục ký quỹ\nHướng dẫn giao dịch ký quỹ\n\n\nLệnh điều kiện cơ sởLệnh trước ngày\nLệnh xu hướng\nLệnh chốt lời\nLệnh cắt lỗ\nLệnh tranh mua tranh bán\nQuản lý lệnh điều kiện\n\n\nPhái sinhKhái niệm và Quy tắc giao dịch\nQuy trình giao dịch CKPS tại Pinetree\nChính sách sản phẩm CKPS tại Pinetree\nHướng dẫn sử dụng Lệnh điều kiện CKPS - WebTrading\nHướng dẫn sử dụng Lệnh điều kiện CKPS - AlphaTrading\nFAQ Lệnh điều kiện CKPS\nT&C - Lệnh Điều kiện trong giao dịch CKPS\n\n\nHướng dẫn Giao dịch Trái phiếu Doanh nghiệp riêng lẻ\nHướng dẫn giao dịch công cụ nợ\nCổ phiếu\nCác loại lệnh chứng khoán\nQuy tắc giao dịch', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='544041d1-e75b-421b-a651-edea6c5a29be', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='0e9b3e8c-c0d6-43b4-9edd-031d29b4e204', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='8c7c3d8bf6c797306a4344285c19525f6c6f737bb49ec85ac4cfe6b996a4563d'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='df3ac472-afba-4e8a-bdb3-3e7fda7ec18b', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='88905db6eefc8fb2a33eb766a3eb5480e42873d0ad01610ae61efc58899ef45b')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Cổ phiếu', mimetype='text/plain', start_char_idx=22857, end_char_idx=22865, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='df3ac472-afba-4e8a-bdb3-3e7fda7ec18b', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='544041d1-e75b-421b-a651-edea6c5a29be', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='f58ff75e7302ef6f3da4aaced9f8e77d7558caf69dbdc3d3e35195c1703ce398'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='18519753-b78e-4c50-b432-93f0b35a5481', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='b23f84f7a6f6dd6747b5e6abc4d04566879dabeb00887f17050eac1388170562')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Các loại lệnh chứng khoán\nQuy tắc giao dịch\nỨng trước tiền bán chứng khoán\nDịch vụ ứng trước tiền bán chứng khoán\nCách đăng ký dịch vụ ứng trước tiền bán chứng khoán\nHướng dẫn', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='18519753-b78e-4c50-b432-93f0b35a5481', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='df3ac472-afba-4e8a-bdb3-3e7fda7ec18b', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='88905db6eefc8fb2a33eb766a3eb5480e42873d0ad01610ae61efc58899ef45b'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='39aba0a5-a340-4e5b-a010-25200354848f', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='007a4e201350b7c2c20354fdcfe3bd8a8587eb1f43a395e648a49a1da2a92071')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Ứng trước tiền bán chứng khoán', mimetype='text/plain', start_char_idx=46904, end_char_idx=46934, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='39aba0a5-a340-4e5b-a010-25200354848f', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='18519753-b78e-4c50-b432-93f0b35a5481', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='b23f84f7a6f6dd6747b5e6abc4d04566879dabeb00887f17050eac1388170562'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='e52ac50d-c35f-49f5-a1af-93be83eec570', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='42164dc2ef100bb8fc8075f5dddcbee630be614c415c507d09cfad40483f31ae')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Dịch vụ ứng trước tiền bán chứng khoán\nCách đăng ký dịch vụ ứng trước tiền bán chứng khoán\nHướng dẫn\nGiao dịch ký quỹ\nCách đăng ký giao dịch ký quỹ\nDanh mục ký quỹ\nHướng dẫn giao dịch ký quỹ', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='e52ac50d-c35f-49f5-a1af-93be83eec570', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='39aba0a5-a340-4e5b-a010-25200354848f', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='007a4e201350b7c2c20354fdcfe3bd8a8587eb1f43a395e648a49a1da2a92071'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='558149d5-4468-4fd2-afc5-8d19326a97c0', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='2384269639ca5ccbc8d860e031eb223babf47593cb00af7051673e17967e4a17')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Giao dịch ký quỹ', mimetype='text/plain', start_char_idx=25719, end_char_idx=25735, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='558149d5-4468-4fd2-afc5-8d19326a97c0', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='e52ac50d-c35f-49f5-a1af-93be83eec570', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='42164dc2ef100bb8fc8075f5dddcbee630be614c415c507d09cfad40483f31ae'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='aa08ac8b-c1b3-4dfe-b029-4c9d38f55868', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='dc03656be94d6ae170bf81d4e3ce101283da29419cbe997b544028557541ccdc')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Cách đăng ký giao dịch ký quỹ\nDanh mục ký quỹ\nHướng dẫn giao dịch ký quỹ\nLệnh điều kiện cơ sở\nLệnh trước ngày\nLệnh xu hướng\nLệnh chốt lời\nLệnh cắt lỗ\nLệnh tranh mua tranh bán\nQuản lý lệnh điều kiện', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='aa08ac8b-c1b3-4dfe-b029-4c9d38f55868', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='558149d5-4468-4fd2-afc5-8d19326a97c0', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='2384269639ca5ccbc8d860e031eb223babf47593cb00af7051673e17967e4a17'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='ad1c1453-38ce-4b1e-8005-c6e532f056d3', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='3449ff8d8a708d0331bbbdf0f14427e10888a3bc2f437b84bde454a3eac4402f')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Lệnh điều kiện cơ sở', mimetype='text/plain', start_char_idx=48491, end_char_idx=48511, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='ad1c1453-38ce-4b1e-8005-c6e532f056d3', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='aa08ac8b-c1b3-4dfe-b029-4c9d38f55868', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='dc03656be94d6ae170bf81d4e3ce101283da29419cbe997b544028557541ccdc'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='dac11915-5ab3-4117-8b09-6abdd44db41d', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='3cabc5d507d712f51d17195409940e5c103f7313dd001d6f93c7d92dc6ee58df')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Lệnh trước ngày\nLệnh xu hướng\nLệnh chốt lời\nLệnh cắt lỗ\nLệnh tranh mua tranh bán\nQuản lý lệnh điều kiện\nPhái sinh\nKhái niệm và Quy tắc giao dịch\nQuy trình giao dịch CKPS tại Pinetree\nChính sách sản phẩm CKPS tại Pinetree\nHướng dẫn sử dụng Lệnh điều kiện CKPS - WebTrading\nHướng dẫn sử dụng Lệnh điều kiện CKPS - AlphaTrading\nFAQ Lệnh điều kiện CKPS\nT&C - Lệnh Điều kiện trong giao dịch CKPS', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='dac11915-5ab3-4117-8b09-6abdd44db41d', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='ad1c1453-38ce-4b1e-8005-c6e532f056d3', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='3449ff8d8a708d0331bbbdf0f14427e10888a3bc2f437b84bde454a3eac4402f'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='6c88ec77-d979-4576-9441-10e241cfc031', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='ce3d7755022b4f0acc3a16fe3d2cc71a28884babfbe6af3a5d2f7f545733c979')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Phái sinh', mimetype='text/plain', start_char_idx=23356, end_char_idx=23365, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='6c88ec77-d979-4576-9441-10e241cfc031', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='dac11915-5ab3-4117-8b09-6abdd44db41d', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='3cabc5d507d712f51d17195409940e5c103f7313dd001d6f93c7d92dc6ee58df'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='7fc0a166-d354-49c7-8347-11839ddf543e', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='77def75706dfc8084b07da233314fda816f91339c063b3e5e468c687ea5b7896')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Khái niệm và Quy tắc giao dịch\nQuy trình giao dịch CKPS tại Pinetree\nChính sách sản phẩm CKPS tại Pinetree\nHướng dẫn sử dụng Lệnh điều kiện CKPS - WebTrading\nHướng dẫn sử dụng Lệnh điều kiện CKPS - AlphaTrading\nFAQ Lệnh điều kiện CKPS\nT&C - Lệnh Điều kiện trong giao dịch CKPS\nHướng dẫn Giao dịch Trái phiếu Doanh nghiệp riêng lẻ', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='7fc0a166-d354-49c7-8347-11839ddf543e', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='6c88ec77-d979-4576-9441-10e241cfc031', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='ce3d7755022b4f0acc3a16fe3d2cc71a28884babfbe6af3a5d2f7f545733c979'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='594123d7-8304-4f1f-b0f9-73f653f6e2be', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='8dbaa0c324fac59f8732b2f42d3ee34da778b094dfe39b99eaecea91a1ee2aa0')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Hướng dẫn Giao dịch Trái phiếu Doanh nghiệp riêng lẻ', mimetype='text/plain', start_char_idx=51342, end_char_idx=51394, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='594123d7-8304-4f1f-b0f9-73f653f6e2be', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='7fc0a166-d354-49c7-8347-11839ddf543e', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='77def75706dfc8084b07da233314fda816f91339c063b3e5e468c687ea5b7896'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='e3c16a2e-3c1e-4fe4-a483-c4d0c289a4a8', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='0b5f81207453d2f1a42ada82adf1e5917d11b9cacdd6e98cbc63440f47790691')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Hướng dẫn giao dịch công cụ nợ', mimetype='text/plain', start_char_idx=51559, end_char_idx=51589, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='e3c16a2e-3c1e-4fe4-a483-c4d0c289a4a8', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='594123d7-8304-4f1f-b0f9-73f653f6e2be', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='8dbaa0c324fac59f8732b2f42d3ee34da778b094dfe39b99eaecea91a1ee2aa0'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='fcd37f13-6711-4e68-aac1-19b2a80eba89', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='6d8fe179233aa1381aa7b2164683723e84171a204dad799d5511a44a18d454ed')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Hướng dẫn giao dịch công cụ nợ', mimetype='text/plain', start_char_idx=51559, end_char_idx=51589, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='fcd37f13-6711-4e68-aac1-19b2a80eba89', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='e3c16a2e-3c1e-4fe4-a483-c4d0c289a4a8', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='0b5f81207453d2f1a42ada82adf1e5917d11b9cacdd6e98cbc63440f47790691'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='fec5b09d-0684-4240-b4d3-9a56b157b345', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='387c1da13973bbd88da38e41a92bd5e9769528802088aaa7e11983689bd0b32f')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Giao dịch tiền\nNộp tiền vào tài khoản\nRút tiền từ tài khoản\nHướng dẫn đính chính, tra soát\nNộp tiền vào tài khoản', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='fec5b09d-0684-4240-b4d3-9a56b157b345', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='fcd37f13-6711-4e68-aac1-19b2a80eba89', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='6d8fe179233aa1381aa7b2164683723e84171a204dad799d5511a44a18d454ed'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='f3ad23a4-7abb-4ea4-ac58-404fa925dd4b', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='7fb15ccac879415f4175bda76f95674509f309af3651ef231c682ebc49db8bee')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Nộp tiền vào tài khoản', mimetype='text/plain', start_char_idx=51960, end_char_idx=51982, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='f3ad23a4-7abb-4ea4-ac58-404fa925dd4b', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='fec5b09d-0684-4240-b4d3-9a56b157b345', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='387c1da13973bbd88da38e41a92bd5e9769528802088aaa7e11983689bd0b32f'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='80924bcb-2b78-4acd-a3f2-54cbc37da1f9', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='2290355c933aeea502421e0542a2a4ceb07a91d77ad6d38c5f588ae5a39e61b3')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Rút tiền từ tài khoản', mimetype='text/plain', start_char_idx=52143, end_char_idx=52164, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='80924bcb-2b78-4acd-a3f2-54cbc37da1f9', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='f3ad23a4-7abb-4ea4-ac58-404fa925dd4b', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='7fb15ccac879415f4175bda76f95674509f309af3651ef231c682ebc49db8bee'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='09a35311-f4cb-4d19-b0bb-71704d31f797', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='05aa4969b2cadb72500732b165b14d532e6bddc794557a3328dfd7214931870a')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Rút tiền từ tài khoản', mimetype='text/plain', start_char_idx=52143, end_char_idx=52164, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='09a35311-f4cb-4d19-b0bb-71704d31f797', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='80924bcb-2b78-4acd-a3f2-54cbc37da1f9', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='2290355c933aeea502421e0542a2a4ceb07a91d77ad6d38c5f588ae5a39e61b3'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='44f6689f-4b24-4249-8bce-4d7a0f83311a', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='6333f9aee628cadd14cb4eb8ca54d312b58a2fdd5a2d3fb80c8716e1b776a001')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Hướng dẫn đính chính, tra soát', mimetype='text/plain', start_char_idx=52333, end_char_idx=52363, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='44f6689f-4b24-4249-8bce-4d7a0f83311a', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='09a35311-f4cb-4d19-b0bb-71704d31f797', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='05aa4969b2cadb72500732b165b14d532e6bddc794557a3328dfd7214931870a'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='514d20ce-f83e-49cd-be32-808e698d2c6c', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='ef72ab3d404505d2c7c6f3dc328a3f7e54c1a39b9dd49d15129e9c05b31e9f6b')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Hướng dẫn đính chính, tra soát', mimetype='text/plain', start_char_idx=52333, end_char_idx=52363, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='514d20ce-f83e-49cd-be32-808e698d2c6c', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='44f6689f-4b24-4249-8bce-4d7a0f83311a', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='6333f9aee628cadd14cb4eb8ca54d312b58a2fdd5a2d3fb80c8716e1b776a001'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='8e9b4959-cad1-404e-9b6e-f0cf4c388b1d', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='475b0fde1020978be4f3a860d3015612062aa64421376b0563d255024e318d2f')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Hướng dẫn sử dụng\nAlphaTradingThông tin chung\nHướng dẫn đặt lệnh\nSử dụng AlphaTrading\nTài khoản chứng khoán\n\n\nPineXThông tin chung\nTham gia mạng xã hội PineX\nKhám phá PineX\nSử dụng PineX\nQuà tặng\nHướng dẫn đặt lệnh\nTiện ích tài chính\n\n\nWebTrading\nWebview (Nam A Bank)\nHướng dẫn sử dụng Phương thức xác thực\nAlphaTrading\nThông tin chung\nHướng dẫn đặt lệnh\nSử dụng AlphaTrading\nTài khoản chứng khoán', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='8e9b4959-cad1-404e-9b6e-f0cf4c388b1d', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='514d20ce-f83e-49cd-be32-808e698d2c6c', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='ef72ab3d404505d2c7c6f3dc328a3f7e54c1a39b9dd49d15129e9c05b31e9f6b'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='2d1d37ff-1772-4226-b233-cf3644555001', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='9d4c1de8f2c5b89661903a4d93275e811e89150bc3d6fe97df0d1e6a4d7f3989')}, metadata_template='{key}: {value}', metadata_separator='\n', text='AlphaTrading', mimetype='text/plain', start_char_idx=24100, end_char_idx=24112, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='2d1d37ff-1772-4226-b233-cf3644555001', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='8e9b4959-cad1-404e-9b6e-f0cf4c388b1d', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='475b0fde1020978be4f3a860d3015612062aa64421376b0563d255024e318d2f'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='a9b0425b-aae0-49fb-9c63-c4930c7049df', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='4f50128c9bd0597ebce857c422e8cdb43bd95eb4bbc2ae5227438eb029e686a0')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Thông tin chung\nHướng dẫn đặt lệnh\nSử dụng AlphaTrading\nTài khoản chứng khoán\nPineX\nThông tin chung\nTham gia mạng xã hội PineX\nKhám phá PineX\nSử dụng PineX\nQuà tặng\nHướng dẫn đặt lệnh\nTiện ích tài chính', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='a9b0425b-aae0-49fb-9c63-c4930c7049df', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='2d1d37ff-1772-4226-b233-cf3644555001', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='9d4c1de8f2c5b89661903a4d93275e811e89150bc3d6fe97df0d1e6a4d7f3989'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='0360112d-a5b2-495e-bb27-693c0599c75b', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='ec0308115b25dea539ca91cb1a97c21b6e52c3b7f27495e4a0680536b1303df2')}, metadata_template='{key}: {value}', metadata_separator='\n', text='PineX', mimetype='text/plain', start_char_idx=24406, end_char_idx=24411, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='0360112d-a5b2-495e-bb27-693c0599c75b', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='a9b0425b-aae0-49fb-9c63-c4930c7049df', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='4f50128c9bd0597ebce857c422e8cdb43bd95eb4bbc2ae5227438eb029e686a0'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='154460b2-04e9-4f99-a40d-09038e65cf4a', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='04924fd7156f680d5c4d7a20c764c266996d10fd2731ce0c66c46478b8ecefb0')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Thông tin chung\nTham gia mạng xã hội PineX\nKhám phá PineX\nSử dụng PineX\nQuà tặng\nHướng dẫn đặt lệnh\nTiện ích tài chính\nWebTrading', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='154460b2-04e9-4f99-a40d-09038e65cf4a', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='0360112d-a5b2-495e-bb27-693c0599c75b', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='ec0308115b25dea539ca91cb1a97c21b6e52c3b7f27495e4a0680536b1303df2'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='8e8a082e-18bb-467b-952c-dcbdd13d1ee8', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='dd626105052b7ebdf4fa2b7661cc600d52c53ffe3c5d0e3474c24e82e55abef5')}, metadata_template='{key}: {value}', metadata_separator='\n', text='WebTrading', mimetype='text/plain', start_char_idx=24241, end_char_idx=24251, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='8e8a082e-18bb-467b-952c-dcbdd13d1ee8', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='154460b2-04e9-4f99-a40d-09038e65cf4a', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='04924fd7156f680d5c4d7a20c764c266996d10fd2731ce0c66c46478b8ecefb0'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='4c06e84b-579a-416c-95e8-e483730ac98f', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='09bb0decb71399660f51806df8fd900dea914fb4c5a8a40b94681b2f512bbefe')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Webview (Nam A Bank)', mimetype='text/plain', start_char_idx=55292, end_char_idx=55312, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='4c06e84b-579a-416c-95e8-e483730ac98f', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='8e8a082e-18bb-467b-952c-dcbdd13d1ee8', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='dd626105052b7ebdf4fa2b7661cc600d52c53ffe3c5d0e3474c24e82e55abef5'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='066cc05c-1bee-4751-9eae-7a4e6c234b8b', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='6ae91e4977b6ca3d36c896afbe557276deb782306b83ef6468342b66c995161e')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Webview (Nam A Bank)', mimetype='text/plain', start_char_idx=55292, end_char_idx=55312, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='066cc05c-1bee-4751-9eae-7a4e6c234b8b', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='4c06e84b-579a-416c-95e8-e483730ac98f', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='09bb0decb71399660f51806df8fd900dea914fb4c5a8a40b94681b2f512bbefe'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='2c917d46-9e8c-4610-b683-74c9be4fe9a1', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='75999928160337dd9bf6b08e862cd1d0e53972cf132d10be10c9f689f6395bef')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Hướng dẫn sử dụng Phương thức xác thực', mimetype='text/plain', start_char_idx=55469, end_char_idx=55507, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='2c917d46-9e8c-4610-b683-74c9be4fe9a1', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='066cc05c-1bee-4751-9eae-7a4e6c234b8b', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='6ae91e4977b6ca3d36c896afbe557276deb782306b83ef6468342b66c995161e'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='3cd96820-afb7-4b84-a9d6-8095979176c8', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='28ab81123894c40e879fc20143d5be69076870ad6cb0ca3434829606a15a16b8')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Hướng dẫn sử dụng Phương thức xác thực', mimetype='text/plain', start_char_idx=55469, end_char_idx=55507, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='3cd96820-afb7-4b84-a9d6-8095979176c8', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='2c917d46-9e8c-4610-b683-74c9be4fe9a1', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='75999928160337dd9bf6b08e862cd1d0e53972cf132d10be10c9f689f6395bef'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='b8325ba4-28c3-4ec8-ae0d-807a4e8bfac2', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='d41dfc9fc342d5c00eba73d9a5b54be23a07a544c31f380506286e96365c0eff')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Lưu ký chứng khoán\nLưu ký chứng khoán/ Rút lưu ký chứng khoán\nThực hiện quyền mua – Chuyển nhượng quyền mua\nChuyển khoản chứng khoán\nGiao dịch chứng khoán lô lẻ\nChuyển chủ sở hữu chứng khoán\nThừa kế chứng khoán\nLưu ký chứng khoán/ Rút lưu ký chứng khoán', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='b8325ba4-28c3-4ec8-ae0d-807a4e8bfac2', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='3cd96820-afb7-4b84-a9d6-8095979176c8', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='28ab81123894c40e879fc20143d5be69076870ad6cb0ca3434829606a15a16b8'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='5952a3e8-56f6-4a32-970d-9bd3321edb58', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='5b6dcb433a7fef77fbf698c9d080a5bdf8a70d8b9175d02596e8f18ce0db8ecd')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Lưu ký chứng khoán/ Rút lưu ký chứng khoán', mimetype='text/plain', start_char_idx=55901, end_char_idx=55943, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='5952a3e8-56f6-4a32-970d-9bd3321edb58', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='b8325ba4-28c3-4ec8-ae0d-807a4e8bfac2', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='d41dfc9fc342d5c00eba73d9a5b54be23a07a544c31f380506286e96365c0eff'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='c662ffde-5684-44b1-bc27-063e7d56ae4d', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='a5d36d25a39399b4947b59284298beabda28b7179f25efdf22024dc1ce3593bb')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Thực hiện quyền mua – Chuyển nhượng quyền mua', mimetype='text/plain', start_char_idx=56126, end_char_idx=56171, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='c662ffde-5684-44b1-bc27-063e7d56ae4d', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='5952a3e8-56f6-4a32-970d-9bd3321edb58', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='5b6dcb433a7fef77fbf698c9d080a5bdf8a70d8b9175d02596e8f18ce0db8ecd'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='66976ae2-383b-405d-95e2-0cfb1e628fe5', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='db6fb25c2427938105ba73be7b0e79f9c9d824d57449651c1098a963da0a0488')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Thực hiện quyền mua – Chuyển nhượng quyền mua', mimetype='text/plain', start_char_idx=56126, end_char_idx=56171, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='66976ae2-383b-405d-95e2-0cfb1e628fe5', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='c662ffde-5684-44b1-bc27-063e7d56ae4d', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='a5d36d25a39399b4947b59284298beabda28b7179f25efdf22024dc1ce3593bb'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='1e2718be-35b3-4022-ac49-f81626aaeff1', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='870d10547bb2a4774ebaca8ab1e7f8afe0184520ebe57da8745ae899e682021b')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Chuyển khoản chứng khoán', mimetype='text/plain', start_char_idx=56335, end_char_idx=56359, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='1e2718be-35b3-4022-ac49-f81626aaeff1', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='66976ae2-383b-405d-95e2-0cfb1e628fe5', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='db6fb25c2427938105ba73be7b0e79f9c9d824d57449651c1098a963da0a0488'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='233a3be6-dd67-42cd-b43f-611c5f23dff7', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='22946feccceb5a0ef1eee532fe2b44bd409be90cb590ae8cbc68dfcd21387ebc')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Chuyển khoản chứng khoán', mimetype='text/plain', start_char_idx=56335, end_char_idx=56359, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='233a3be6-dd67-42cd-b43f-611c5f23dff7', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='1e2718be-35b3-4022-ac49-f81626aaeff1', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='870d10547bb2a4774ebaca8ab1e7f8afe0184520ebe57da8745ae899e682021b'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='6e19160c-a40e-426d-8eac-ffc54e429b8a', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='4145e534153944e4b501fea85a59650002829bd0a71335bbfec0a4396d8a46e2')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Giao dịch chứng khoán lô lẻ', mimetype='text/plain', start_char_idx=56526, end_char_idx=56553, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='6e19160c-a40e-426d-8eac-ffc54e429b8a', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='233a3be6-dd67-42cd-b43f-611c5f23dff7', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='22946feccceb5a0ef1eee532fe2b44bd409be90cb590ae8cbc68dfcd21387ebc'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='f58897c4-f58a-4d84-95b7-01eb6665802d', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='ba10d58e193f7a1fa0c155b72b97e95406960fb46bf04b54be22565473975fb6')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Giao dịch chứng khoán lô lẻ', mimetype='text/plain', start_char_idx=56526, end_char_idx=56553, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='f58897c4-f58a-4d84-95b7-01eb6665802d', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='6e19160c-a40e-426d-8eac-ffc54e429b8a', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='4145e534153944e4b501fea85a59650002829bd0a71335bbfec0a4396d8a46e2'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='9c8ff8d6-acda-4206-8e52-707b97e64614', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='84503b25f69df89f253324af6a9ec1d4ffae8b36f68ecf36e8118460063fde82')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Chuyển chủ sở hữu chứng khoán', mimetype='text/plain', start_char_idx=56722, end_char_idx=56751, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='9c8ff8d6-acda-4206-8e52-707b97e64614', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='f58897c4-f58a-4d84-95b7-01eb6665802d', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='ba10d58e193f7a1fa0c155b72b97e95406960fb46bf04b54be22565473975fb6'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='ef2c4ed2-4f0f-477d-904b-38c27f989bdb', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='03e8001768e2c36e44d3f915bb00219631d9eb1c058fcc2e35ad46676cd064f5')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Chuyển chủ sở hữu chứng khoán', mimetype='text/plain', start_char_idx=56722, end_char_idx=56751, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='ef2c4ed2-4f0f-477d-904b-38c27f989bdb', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='9c8ff8d6-acda-4206-8e52-707b97e64614', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='84503b25f69df89f253324af6a9ec1d4ffae8b36f68ecf36e8118460063fde82'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='634d5fdd-80ca-424f-94fb-0ac9c04222ad', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='f1dfd35f128b9702c6607a61a894bdfc875c08223fb2f7f42349f2c26373e3ad')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Thừa kế chứng khoán', mimetype='text/plain', start_char_idx=56910, end_char_idx=56929, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='634d5fdd-80ca-424f-94fb-0ac9c04222ad', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='ef2c4ed2-4f0f-477d-904b-38c27f989bdb', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='03e8001768e2c36e44d3f915bb00219631d9eb1c058fcc2e35ad46676cd064f5'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='550e6f91-9760-4e08-9bfa-f85c188b203a', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='cc411aa0690096ddd3812e6006a03f40d57b9df0cc065346aba210b2ccf41491')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Thừa kế chứng khoán', mimetype='text/plain', start_char_idx=56910, end_char_idx=56929, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='550e6f91-9760-4e08-9bfa-f85c188b203a', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='634d5fdd-80ca-424f-94fb-0ac9c04222ad', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='f1dfd35f128b9702c6607a61a894bdfc875c08223fb2f7f42349f2c26373e3ad'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='4f08394a-896e-499c-ab63-c727e27c912b', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='f605ae72578e1af2f99c1afefc70d63431a1690901a6baf280fb0d23406bd59d')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Chính sách Trái phiếu PineB\nHướng dẫn công bố thông tin\nHướng dẫn công bố thông tin của cổ đông lớn\nHướng dẫn công bố thông tin của người nội bộ và người liên quan\nHướng dẫn công bố thông tin của cổ đông lớn', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='4f08394a-896e-499c-ab63-c727e27c912b', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='550e6f91-9760-4e08-9bfa-f85c188b203a', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='cc411aa0690096ddd3812e6006a03f40d57b9df0cc065346aba210b2ccf41491'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='681e5381-b686-4f7c-8fe4-49a65e14ed17', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='b5a1ab30dd405a86828ace7cb29825341c6944d85f18d4a4d6888dc0e3c84ac4')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Hướng dẫn công bố thông tin của cổ đông lớn', mimetype='text/plain', start_char_idx=57530, end_char_idx=57573, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='681e5381-b686-4f7c-8fe4-49a65e14ed17', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='4f08394a-896e-499c-ab63-c727e27c912b', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='f605ae72578e1af2f99c1afefc70d63431a1690901a6baf280fb0d23406bd59d'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='3be06784-1adc-4db8-b1d1-8a3c18dd5430', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='0359334a293f2ce6a5ec4c385f17a4ce89ecc29704789a35478c2e7b9719344c')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Hướng dẫn công bố thông tin của người nội bộ và người liên quan', mimetype='text/plain', start_char_idx=57772, end_char_idx=57835, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='3be06784-1adc-4db8-b1d1-8a3c18dd5430', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='681e5381-b686-4f7c-8fe4-49a65e14ed17', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='b5a1ab30dd405a86828ace7cb29825341c6944d85f18d4a4d6888dc0e3c84ac4'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='8b804b8d-0395-4d92-8527-441df995fd6b', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='c5a962e7c7aa0ab75dea9d9f26f7d8ef0705db1ac988d0a2ca8483e0ac2e9a03')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Hướng dẫn công bố thông tin của người nội bộ và người liên quan', mimetype='text/plain', start_char_idx=57772, end_char_idx=57835, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='8b804b8d-0395-4d92-8527-441df995fd6b', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='3be06784-1adc-4db8-b1d1-8a3c18dd5430', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='0359334a293f2ce6a5ec4c385f17a4ce89ecc29704789a35478c2e7b9719344c'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='7f507624-47a6-4dbe-aece-474abbfd2b20', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='5d105a418a3f8ebe2dfb0a7091a2863216e0061e471193818017d8725d9c2d34')}, metadata_template='{key}: {value}', metadata_separator='\n', text='FAQ\nMở/Đóng tài khoản\nGiao dịch tiền\nDịch vụ tài chính - Margin\nTrái phiếu\nPinefolio\nPhái sinh\nDịch vụ chứng khoán\nThông tin khách hàng/Xác thực\nMở/Đóng tài khoản', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='7f507624-47a6-4dbe-aece-474abbfd2b20', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='8b804b8d-0395-4d92-8527-441df995fd6b', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='c5a962e7c7aa0ab75dea9d9f26f7d8ef0705db1ac988d0a2ca8483e0ac2e9a03'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='93b983c7-7195-4ec4-9b9f-e6e88d1aae95', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='dbb4960fa980f8530f9261de437b4110029058a8d9a56ca15fb0ab73938dc896')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Mở/Đóng tài khoản', mimetype='text/plain', start_char_idx=58187, end_char_idx=58204, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='93b983c7-7195-4ec4-9b9f-e6e88d1aae95', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='7f507624-47a6-4dbe-aece-474abbfd2b20', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='5d105a418a3f8ebe2dfb0a7091a2863216e0061e471193818017d8725d9c2d34'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='fd26d3da-46d6-4552-9f4c-13a7d850b76f', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='88a48fe89f3d0e6426994bd523124881a3bbfbc2cc8dc269b3d5bcd885763722')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Giao dịch tiền', mimetype='text/plain', start_char_idx=33388, end_char_idx=33402, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='fd26d3da-46d6-4552-9f4c-13a7d850b76f', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='93b983c7-7195-4ec4-9b9f-e6e88d1aae95', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='dbb4960fa980f8530f9261de437b4110029058a8d9a56ca15fb0ab73938dc896'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='8f0866a4-787a-48cd-881b-b285b667b320', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='55f75840f04e198ecc4386d909484be507357b50a1eeb34336e41172aea17e1b')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Giao dịch tiền', mimetype='text/plain', start_char_idx=33388, end_char_idx=33402, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='8f0866a4-787a-48cd-881b-b285b667b320', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='fd26d3da-46d6-4552-9f4c-13a7d850b76f', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='88a48fe89f3d0e6426994bd523124881a3bbfbc2cc8dc269b3d5bcd885763722'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='4ffb1366-aee4-47f2-a08a-55d53547093c', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='9859c4ed3bd6892cc0c1b9d2086fbe2ed110934eb1a1eecda4941b7dec175935')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Dịch vụ tài chính - Margin', mimetype='text/plain', start_char_idx=58528, end_char_idx=58554, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='4ffb1366-aee4-47f2-a08a-55d53547093c', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='8f0866a4-787a-48cd-881b-b285b667b320', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='55f75840f04e198ecc4386d909484be507357b50a1eeb34336e41172aea17e1b'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='c3f7cdb9-4a25-48f9-9ccd-d33ff0044513', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='a36e2bdca02fbdafb7ca91708bf6f557a57cd66f8079266ef00b3146fdfee6e3')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Dịch vụ tài chính - Margin', mimetype='text/plain', start_char_idx=58528, end_char_idx=58554, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='c3f7cdb9-4a25-48f9-9ccd-d33ff0044513', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='4ffb1366-aee4-47f2-a08a-55d53547093c', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='9859c4ed3bd6892cc0c1b9d2086fbe2ed110934eb1a1eecda4941b7dec175935'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='0617c538-75bb-41f9-beff-39252cd25b2e', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='c403d83f8a3c11c794eceea7fd1d7038fb33409b6305f6ad152880b86b93e7e5')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Trái phiếu', mimetype='text/plain', start_char_idx=23023, end_char_idx=23033, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='0617c538-75bb-41f9-beff-39252cd25b2e', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='c3f7cdb9-4a25-48f9-9ccd-d33ff0044513', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='a36e2bdca02fbdafb7ca91708bf6f557a57cd66f8079266ef00b3146fdfee6e3'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='06a32a18-e95b-4254-a4ea-e0641676ca39', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='def34d8ba3519e9c11d4b8f43140bb12bb64f13f37ad86dc9ed80dd2232da63c')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Trái phiếu', mimetype='text/plain', start_char_idx=23023, end_char_idx=23033, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='06a32a18-e95b-4254-a4ea-e0641676ca39', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='0617c538-75bb-41f9-beff-39252cd25b2e', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='c403d83f8a3c11c794eceea7fd1d7038fb33409b6305f6ad152880b86b93e7e5'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='f3561b4b-1866-4c7d-a0b6-42d3fd47d0b1', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='e26a9e169e34b211b0705aa0fe5318e7f2899800384fc7c7d4124a64d16bcd29')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Pinefolio', mimetype='text/plain', start_char_idx=58854, end_char_idx=58863, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='f3561b4b-1866-4c7d-a0b6-42d3fd47d0b1', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='06a32a18-e95b-4254-a4ea-e0641676ca39', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='def34d8ba3519e9c11d4b8f43140bb12bb64f13f37ad86dc9ed80dd2232da63c'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='118174db-f272-4ea3-a4d5-85c7dd3903b3', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='ebf013a4cdfd977ed6c13c8a31dbbceabc7c9e3ca4ae47c737d70a8eb870f234')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Pinefolio', mimetype='text/plain', start_char_idx=58854, end_char_idx=58863, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='118174db-f272-4ea3-a4d5-85c7dd3903b3', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='f3561b4b-1866-4c7d-a0b6-42d3fd47d0b1', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='e26a9e169e34b211b0705aa0fe5318e7f2899800384fc7c7d4124a64d16bcd29'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='a9081971-6e77-4698-b7d0-fe518aebbd30', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='3cabc5d507d712f51d17195409940e5c103f7313dd001d6f93c7d92dc6ee58df')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Phái sinh', mimetype='text/plain', start_char_idx=23356, end_char_idx=23365, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='a9081971-6e77-4698-b7d0-fe518aebbd30', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='118174db-f272-4ea3-a4d5-85c7dd3903b3', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='ebf013a4cdfd977ed6c13c8a31dbbceabc7c9e3ca4ae47c737d70a8eb870f234'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='5425acf6-ae93-4033-a252-454d38eef3e6', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='71aba903992ad075dfd11618261413ad787679bfa54ada12250115327c8346f2')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Phái sinh', mimetype='text/plain', start_char_idx=23356, end_char_idx=23365, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='5425acf6-ae93-4033-a252-454d38eef3e6', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='a9081971-6e77-4698-b7d0-fe518aebbd30', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='3cabc5d507d712f51d17195409940e5c103f7313dd001d6f93c7d92dc6ee58df'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='87d1443a-dc90-4220-a6c5-63102b5d3fa9', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='5f011dc0e45c8bec41bb6ed85723e7f0bbdd4a12bde7fa0382be01f8dda76a81')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Dịch vụ chứng khoán', mimetype='text/plain', start_char_idx=59172, end_char_idx=59191, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='87d1443a-dc90-4220-a6c5-63102b5d3fa9', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='5425acf6-ae93-4033-a252-454d38eef3e6', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='71aba903992ad075dfd11618261413ad787679bfa54ada12250115327c8346f2'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='47f2573e-4af8-4832-b908-ee775aee1714', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='3e1fa3eac05881ba4ae0a2199c3b03ce4fd1b8cbc06964f9275486a22eff3b35')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Dịch vụ chứng khoán', mimetype='text/plain', start_char_idx=59172, end_char_idx=59191, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='47f2573e-4af8-4832-b908-ee775aee1714', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='87d1443a-dc90-4220-a6c5-63102b5d3fa9', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='5f011dc0e45c8bec41bb6ed85723e7f0bbdd4a12bde7fa0382be01f8dda76a81'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='8d6ae5eb-1d0f-48bb-9139-ba02c671db0e', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='0c7eb6abbcdd7b2d70b2ee867486c794e5b7a3cd44f2cf8d76bb378f79694bb3')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Thông tin khách hàng/Xác thực', mimetype='text/plain', start_char_idx=59356, end_char_idx=59385, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='8d6ae5eb-1d0f-48bb-9139-ba02c671db0e', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='47f2573e-4af8-4832-b908-ee775aee1714', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='3e1fa3eac05881ba4ae0a2199c3b03ce4fd1b8cbc06964f9275486a22eff3b35'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='915eddfc-0f47-4050-81fa-d007845a7b20', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='d341a6066251370f35231b926a3f495b4f87d391bcfa38c7ccec4402d33e3a03')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Thông tin khách hàng/Xác thực', mimetype='text/plain', start_char_idx=59356, end_char_idx=59385, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='915eddfc-0f47-4050-81fa-d007845a7b20', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='8d6ae5eb-1d0f-48bb-9139-ba02c671db0e', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='0c7eb6abbcdd7b2d70b2ee867486c794e5b7a3cd44f2cf8d76bb378f79694bb3'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='6948d7ab-c8ba-4d10-bd1b-f6a3b7fc7142', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='dd606f7d6d825780b31cda2a97ab33a90e556df4441b410f67ddf28e3eba2132')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Bản công bố rủi ro\nChính sách xử lý dữ liệu cá nhân\nXác nhận nhà đầu tư chuyên nghiệp\nChương trình phát triển khách hàng\nĐiều khoản và điều kiện\nHướng dẫn đăng ký\nĐiều khoản và điều kiện', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='6948d7ab-c8ba-4d10-bd1b-f6a3b7fc7142', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='915eddfc-0f47-4050-81fa-d007845a7b20', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='d341a6066251370f35231b926a3f495b4f87d391bcfa38c7ccec4402d33e3a03'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='db66acbb-969d-48ae-9827-aaa8d235db57', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='9af2074e5b992f57794dda03a4400983c07b6d72b8f18aa088a49d445519de48')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Điều khoản và điều kiện', mimetype='text/plain', start_char_idx=60379, end_char_idx=60402, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='db66acbb-969d-48ae-9827-aaa8d235db57', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='6948d7ab-c8ba-4d10-bd1b-f6a3b7fc7142', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='dd606f7d6d825780b31cda2a97ab33a90e556df4441b410f67ddf28e3eba2132'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='abdd0f59-9ca2-402a-b86c-6c029a3bb7cd', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='c3fbb7ef6ff9c50598fd72921cbbd743529103e43a7183fe723b8cde6ba84f91')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Hướng dẫn đăng ký', mimetype='text/plain', start_char_idx=60555, end_char_idx=60572, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='abdd0f59-9ca2-402a-b86c-6c029a3bb7cd', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='db66acbb-969d-48ae-9827-aaa8d235db57', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='9af2074e5b992f57794dda03a4400983c07b6d72b8f18aa088a49d445519de48'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='bbbe2978-2e04-477f-b94e-bdf0478e708a', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='cb9a02c33981899de1f68a6247cd94149c01e91006b00bc8e1e4fe74c3d1173a')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Hướng dẫn đăng ký', mimetype='text/plain', start_char_idx=60555, end_char_idx=60572, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='bbbe2978-2e04-477f-b94e-bdf0478e708a', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='abdd0f59-9ca2-402a-b86c-6c029a3bb7cd', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='c3fbb7ef6ff9c50598fd72921cbbd743529103e43a7183fe723b8cde6ba84f91'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='db056be1-5055-4341-983a-e06f9b05fa45', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h2'}, hash='6568f8eb3343ce42d984302c7a2767ecf7b6c398dcf78310060ef97aca51b6b9')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Liên hệ', mimetype='text/plain', start_char_idx=36057, end_char_idx=36064, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='db056be1-5055-4341-983a-e06f9b05fa45', embedding=None, metadata={'tag': 'h2'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='bbbe2978-2e04-477f-b94e-bdf0478e708a', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='cb9a02c33981899de1f68a6247cd94149c01e91006b00bc8e1e4fe74c3d1173a'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='51b19d68-c436-4e20-abfa-49955dc93196', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'p'}, hash='4cf67bd0560190ce8ad635b0c7e5aea71f68633c4445a140ebbef09a75a90dc7')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Mở tài khoản chứng khoán dành cho khách hàng cá nhân', mimetype='text/plain', start_char_idx=43143, end_char_idx=43195, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='51b19d68-c436-4e20-abfa-49955dc93196', embedding=None, metadata={'tag': 'p'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='db056be1-5055-4341-983a-e06f9b05fa45', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h2'}, hash='6568f8eb3343ce42d984302c7a2767ecf7b6c398dcf78310060ef97aca51b6b9'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='3bb5b755-5396-45aa-b556-72361efab07a', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h2'}, hash='28a85aac6011213d21b99fa544a1d58c07f14e3a44cd1c4e772ff051612963f1')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Mở tài khoản chứng khoán tại Pinetree chưa bao giờ dễ dàng đến thế. Quý khách chỉ cần\n2 phút\nđể đăng ký và có thể giao dịch ngay sau khi tạo tài khoản online thành công.\nCông ty chứng khoán duy nhất MIỄN PHÍ GIAO DỊCH TRỌN ĐỜI! Lãi suất Margin chỉ 9.9%/ năm không kèm theo điều kiện.\nCác cách mở tài khoản chứng khoán tại Pinetree:', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='3bb5b755-5396-45aa-b556-72361efab07a', embedding=None, metadata={'tag': 'h2'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='51b19d68-c436-4e20-abfa-49955dc93196', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'p'}, hash='4cf67bd0560190ce8ad635b0c7e5aea71f68633c4445a140ebbef09a75a90dc7'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='ae5ee220-6b2f-4ca2-80fa-9ea3ffa08f6d', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'p'}, hash='4e0bf73042c1fac85d007c978bd9e4d37e20fd17113a05d5c83cb55dad2c0aed')}, metadata_template='{key}: {value}', metadata_separator='\n', text='CÁCH 1: MỞ TÀI KHOẢN TẠI QUẦY', mimetype='text/plain', start_char_idx=61802, end_char_idx=61831, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='ae5ee220-6b2f-4ca2-80fa-9ea3ffa08f6d', embedding=None, metadata={'tag': 'p'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='3bb5b755-5396-45aa-b556-72361efab07a', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h2'}, hash='28a85aac6011213d21b99fa544a1d58c07f14e3a44cd1c4e772ff051612963f1'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='0cdef740-3a66-402b-9d18-02582b36b1de', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h2'}, hash='ead4943b1b8f15928e30aadabf8dc6fc186c3f4187c71769f6c3411b25277ac8')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Quý khách vui lòng mang theo CMND hoặc CCCD còn hiệu lực theo quy định đến trực tiếp tại trụ sở của Pinetree theo địa chỉ như sau:\n\nPhòng\xa0Dịch\xa0vụ\xa0Khách hàng\nCông ty Cổ phần Chứng khoán Pinetree\nĐịa chỉ: Tầng 20, Tòa nhà ROX Tower, 54A Nguyễn Chí Thanh, Láng Thượng, Đống Đa, Hà Nội\n\n\nChuyên viên Pinetree sẽ hỗ trợ và hướng dẫn Quý khách đăng ký mở tài khoản tại quầy.', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='0cdef740-3a66-402b-9d18-02582b36b1de', embedding=None, metadata={'tag': 'h2'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='ae5ee220-6b2f-4ca2-80fa-9ea3ffa08f6d', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'p'}, hash='4e0bf73042c1fac85d007c978bd9e4d37e20fd17113a05d5c83cb55dad2c0aed'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='fba52214-a7e8-478e-92a0-8487de98fb61', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'p'}, hash='0d270da29bf613f4cfba272361a5410898e492f434718dfc644ea64a89597022')}, metadata_template='{key}: {value}', metadata_separator='\n', text='CÁCH 2: MỞ TÀI KHOẢN E-KYC – TÀI KHOẢN ĐƯỢC ACTIVE GIAO DỊCH NGAY TRONG NGÀY', mimetype='text/plain', start_char_idx=62341, end_char_idx=62417, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='fba52214-a7e8-478e-92a0-8487de98fb61', embedding=None, metadata={'tag': 'p'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='0cdef740-3a66-402b-9d18-02582b36b1de', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h2'}, hash='ead4943b1b8f15928e30aadabf8dc6fc186c3f4187c71769f6c3411b25277ac8'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='80c8d66f-d0b9-4bd8-91a8-cb0998124cd6', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h2'}, hash='09cc1db1ec8e4abf250696d0b30e324c7ff3ad9287848917c43908cc373bc90f')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Bước 1:\nQuý khách truy cập App store/ CH play, tải về 1 trong 2 ứng dụng\nAlphatrading\nhoặc PineX.\nBước 2:\nChuẩn bị chứng minh thư bản gốc.\nBước 3:\nThực hiện theo hướng dẫn\ntại đây.', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='80c8d66f-d0b9-4bd8-91a8-cb0998124cd6', embedding=None, metadata={'tag': 'h2'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='fba52214-a7e8-478e-92a0-8487de98fb61', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'p'}, hash='0d270da29bf613f4cfba272361a5410898e492f434718dfc644ea64a89597022'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='9dedb175-7c73-4361-9617-4887ece16dd7', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'p'}, hash='035d495abd4dec208f5e5dcebdf9451c5af4ab1211cfb01bef245b096e3d651c')}, metadata_template='{key}: {value}', metadata_separator='\n', text='CÁCH 3: MỞ TÀI KHOẢN TẠI WEBSITE\n–\nMất 3-4 ngày để hoàn tất hồ sơ', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='9dedb175-7c73-4361-9617-4887ece16dd7', embedding=None, metadata={'tag': 'p'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='80c8d66f-d0b9-4bd8-91a8-cb0998124cd6', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h2'}, hash='09cc1db1ec8e4abf250696d0b30e324c7ff3ad9287848917c43908cc373bc90f'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='a2583b21-73f0-4d41-bf57-602ae3f7ae09', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'b'}, hash='53999fd9020859ae22c4646fc64f7cee4ad6e208057286cc140544ddc630fef8')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Bước 1:\nQuý khách truy cập vào website của Công ty Cổ phần Chứng khoán Pinetree theo đường dẫn sau: https://pinetree.vn/\nBước 2:\nNhấp chuột vào\n“MỞ TÀI KHOẢN”\nnhư hình dưới:\nBước 3:\nSau khi chọn “MỞ TÀI KHOẢN”, Quý khách sẽ được chuyển đến trang điền thông tin mở tài khoản. Quý khách vui lòng điền thông tin đầy đủ và chính xác theo hướng dẫn.\nLưu ý:\nSố điện thoại: Số điện thoại dùng để xác thực tạo tài khoản chứng khoán, xác thực giao dịch và liên hệ với Pinetree.\n\nThông tin cá nhân:\nHọ và tên: Quý khách vui lòng nhập thông tin đầy đủ họ và tên và viết có dấu như trong thông tin ghi trên CMND/CCCD.\nEmail: Hòm thư dùng để xác thực mở tài khoản, nhận thông tin từ Pinetree.\nGiới tính: Quý khách tích chọn Nam hoặc Nữ\nNgày sinh: Thông tin trùng khớp với thông tin trong CMT hoặc Thẻ căn cước.\nThông tin CMT/Thẻ căn Cước: Thông tin số CMT/Thẻ căn cước, ngày cấp và nơi cấp\nThông tin địa chỉ: Quý khách ghi đầy đủ Địa chỉ thường trú và Địa chỉ liên lạc bao gồm: Số nhà, Phường/Xã, Quận/Huyện, Tỉnh/Thành Phố.\nThông tin ngân hàng: Quý khách vui lòng điền thông tin ngân hàng mà Quý khách đang sử dụng để sau này thực hiện chuyển tiền từ tài khoản chứng khoán ra ngoài.\n(Trong trường hợp chưa có tài khoản ngân hàng, Quý khách có thể bỏ qua và bổ sung thêm tài khoản sau khi Đăng ký mở tài khoản thành công)\nBước 4:\nPinetree thông báo tạo tài khoản chứng khoán thành công:\nQuý khách vui lòng kiểm tra Email hoặc tin nhắn điện thoại đã đăng ký khi mở tài khoản để biết thông tin Số tài khoản, thông tin đăng nhập tài khoản chứng khoán và trải nghiệm hệ sinh thái của Pinetree.\nBước 5\n: Quý khách hàng hoàn thiện hợp đồng mở tài khoản để kích hoạt đầy đủ các dịch vụ tiện ích.\n(Hướng dẫn chi tiết trong mục HƯỚNG DẪN HOÀN THIỆN HỢP ĐỒNG MỞ TK TẠI PINETREE).\n\nLưu ý: Việc đăng ký mở tài khoản và hoàn thiện hồ sơ cần được thực hiện bởi chính chủ tài khoản.\nLiên hệ với chúng tôi', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='a2583b21-73f0-4d41-bf57-602ae3f7ae09', embedding=None, metadata={'tag': 'b'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='9dedb175-7c73-4361-9617-4887ece16dd7', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'p'}, hash='035d495abd4dec208f5e5dcebdf9451c5af4ab1211cfb01bef245b096e3d651c'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='c95f3217-0858-4e37-a892-66f57706f3a2', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'p'}, hash='0c89c460a7b26aaba65407779ff01e5e723d409aa83bc5d54c947eb50d064258')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Bạn cần trợ giúp thêm?\nLiên hệ với chúng tôi', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='c95f3217-0858-4e37-a892-66f57706f3a2', embedding=None, metadata={'tag': 'p'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='a2583b21-73f0-4d41-bf57-602ae3f7ae09', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'b'}, hash='53999fd9020859ae22c4646fc64f7cee4ad6e208057286cc140544ddc630fef8'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='81d5375f-c032-4b82-9df7-dd28d8a961ed', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='8ecf6d2abc691636312ce5be94dabf25db288280507f9aac6e06ef39c5aa59a5')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Bạn có tìm được thông tin hữu ích không?', mimetype='text/plain', start_char_idx=67506, end_char_idx=67546, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='81d5375f-c032-4b82-9df7-dd28d8a961ed', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='c95f3217-0858-4e37-a892-66f57706f3a2', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'p'}, hash='0c89c460a7b26aaba65407779ff01e5e723d409aa83bc5d54c947eb50d064258'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='5e9b2dba-df0a-4ff0-8732-ce3472fdaf00', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='396769acc17eed79b1e61f028d5169375d88eb17c9cae502ec5165e26b2b2352')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Sản phẩm & Dịch vụ', mimetype='text/plain', start_char_idx=72944, end_char_idx=72962, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='5e9b2dba-df0a-4ff0-8732-ce3472fdaf00', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='81d5375f-c032-4b82-9df7-dd28d8a961ed', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='8ecf6d2abc691636312ce5be94dabf25db288280507f9aac6e06ef39c5aa59a5'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='83543b92-55ee-4150-8c0a-948f5a422711', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='051a91f2a9cb19cb74b17f103f1a51ba0eb13add9f9306396c15d3d3903ac739')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Dịch vụ\nNền tảng giao dịch', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='83543b92-55ee-4150-8c0a-948f5a422711', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='5e9b2dba-df0a-4ff0-8732-ce3472fdaf00', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='396769acc17eed79b1e61f028d5169375d88eb17c9cae502ec5165e26b2b2352'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='f7e8ef94-75af-48a4-80b0-197d167a0741', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='9d3beb59338acfa4056efc1710ddc1540f853e74647232821d4ef716479e8811')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Hỗ trợ khách hàng', mimetype='text/plain', start_char_idx=32696, end_char_idx=32713, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='f7e8ef94-75af-48a4-80b0-197d167a0741', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='83543b92-55ee-4150-8c0a-948f5a422711', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='051a91f2a9cb19cb74b17f103f1a51ba0eb13add9f9306396c15d3d3903ac739'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='d6f2ab7e-0fa9-4b5c-a2dc-0edc4c091c7c', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='f8afaf2c5feee04fe7a534b4a7ee4f7193802789dad553c18ad3e33e53b20e23')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Sẵn sàng gia nhập Pinetree\nĐầu tư\nGiao dịch tiền\nHướng dẫn sử dụng\nLưu ký chứng khoán\nFAQ\nBản công bố rủi ro\nChính sách xử lý dữ liệu cá nhân', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='d6f2ab7e-0fa9-4b5c-a2dc-0edc4c091c7c', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='f7e8ef94-75af-48a4-80b0-197d167a0741', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='9d3beb59338acfa4056efc1710ddc1540f853e74647232821d4ef716479e8811'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='a144fb47-c0c9-4d07-a037-412a704874dc', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='171f0d4b92c3f282d91200224f62bcdd4fb006548c6c933f8299c28772774c76')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Kiến thức', mimetype='text/plain', start_char_idx=25020, end_char_idx=25029, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='a144fb47-c0c9-4d07-a037-412a704874dc', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='d6f2ab7e-0fa9-4b5c-a2dc-0edc4c091c7c', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='f8afaf2c5feee04fe7a534b4a7ee4f7193802789dad553c18ad3e33e53b20e23'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='ba239951-310a-4789-9bb4-5126e4e1ceba', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='c4b0fe2d11ba4bcd702fb529ba3a412821d4f4a7b54e2f297f8158848dd2ff48')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Digital knowledge center\nCập nhật thị trường\nỨng dụng học và thực hành đầu tư Stock123\nKiến thức cơ bản\nGiao dịch ký quỹ', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='ba239951-310a-4789-9bb4-5126e4e1ceba', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='a144fb47-c0c9-4d07-a037-412a704874dc', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='171f0d4b92c3f282d91200224f62bcdd4fb006548c6c933f8299c28772774c76'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='463aff95-7ddf-4124-90e6-540d43f0ae1c', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='5f9d903ffd63871c92c066a8fbcd9f194bab9b20a07dc9c774433f114ed0c7d9')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Pinetree', mimetype='text/plain', start_char_idx=33000, end_char_idx=33008, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='463aff95-7ddf-4124-90e6-540d43f0ae1c', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='ba239951-310a-4789-9bb4-5126e4e1ceba', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='c4b0fe2d11ba4bcd702fb529ba3a412821d4f4a7b54e2f297f8158848dd2ff48'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='5557ca22-0609-4c49-81f3-2a8ab47becd3', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='ffa6b0f55c242270f65632f5d92570780df24f35c3d245bc7e421e1b5ae2835a')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Giới thiệu\nQuan hệ nhà đầu tư\nTin tức\nCơ hội nghề nghiệp\nLiên hệ', mimetype='text/plain', start_char_idx=None, end_char_idx=None, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='5557ca22-0609-4c49-81f3-2a8ab47becd3', embedding=None, metadata={'tag': 'h3'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='463aff95-7ddf-4124-90e6-540d43f0ae1c', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='5f9d903ffd63871c92c066a8fbcd9f194bab9b20a07dc9c774433f114ed0c7d9'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='102126cd-2330-49b1-a3e1-952a664c9d9a', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'p'}, hash='b64445485eafb1e406a1d0394a3b58760b187d5171d31d91dcff5c39ac5cb2ee')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Đăng ký nhận newsletter', mimetype='text/plain', start_char_idx=79455, end_char_idx=79478, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='102126cd-2330-49b1-a3e1-952a664c9d9a', embedding=None, metadata={'tag': 'p'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='5557ca22-0609-4c49-81f3-2a8ab47becd3', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'h3'}, hash='ffa6b0f55c242270f65632f5d92570780df24f35c3d245bc7e421e1b5ae2835a'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='028adc6c-52b6-49ef-a68f-3b647582eca4', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'li'}, hash='527cd71e74f467ab1401e188cf89c03dff0b709a150b7d8f8091da2e90ab3930')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Nhận thông báo mới nhất', mimetype='text/plain', start_char_idx=79553, end_char_idx=79576, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}'),
TextNode(id_='028adc6c-52b6-49ef-a68f-3b647582eca4', embedding=None, metadata={'tag': 'li'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=[], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='79c25a8f-865a-4247-92cf-59a9d7f3b73b', node_type=<ObjectType.DOCUMENT: '4'>, metadata={}, hash='541e29fb9c2075696bd0c1aef74f134ea40ab28a8d463ea4ec8200dd362b6adf'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='102126cd-2330-49b1-a3e1-952a664c9d9a', node_type=<ObjectType.TEXT: '1'>, metadata={'tag': 'p'}, hash='b64445485eafb1e406a1d0394a3b58760b187d5171d31d91dcff5c39ac5cb2ee')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Sitemap', mimetype='text/plain', start_char_idx=85418, end_char_idx=85425, metadata_seperator='\n', text_template='{metadata_str}\n\n{content}')]
JSONNodeParser
parses raw JSON.
from llama_index.core.node_parser import JSONNodeParser
parser = JSONNodeParser()
nodes = parser.get_nodes_from_documents(json_docs)
MarkdownNodeParser
parses raw markdown text.
from llama_index.core.node_parser import MarkdownNodeParser
parser = MarkdownNodeParser()
nodes = parser.get_nodes_from_documents(markdown_docs)
3.6.6.4.1.3.2. Text-Based Node Parsers#
CodeSplitter
: Splits raw code-text based on the language it is written in.language
: This specifies the language of the codechunk_lines
: This defines the number of lines per chunkchunk_lines_overlap
: This defines the lines overlap between chunksmax_chars
: This defines the maximum characters per chunk
LangchainNodeParser
: Wrap any existing text splitter from langchain with a node parser.
SentenceSplitter
: Phân chia text trong khi giữ lại các câu hoàn chỉnh.
SentenceWindowNodeParser
: Phân chia văn bản thành các câu có số lượng câu nhất địnhWindow_size
: This defines the number of sentences on each side to include in the windowwindow_metadata_key
: This defines the metadata key for the window sentencesoriginal_text_metadata_key
: This defines the metadata key for the original sentence
SemanticSplitterNodeParser
: Phân chia giữa các câu đảm bảo các câu cùng mang ý nghĩa tương tự được nhóm lại với nhau.
TokenTextSplitter
: Phân chia văn bản thành các đoạn văn bản nhỏ hơn dựa trên số lượng token.chunk_size
: This sets the maximum number of tokens for each chunkchunk_overlap
: This defines the overlap in tokens between consecutive chunksseparator
: This is used to determine the primary token boundarybackup_separators
: These can be used for additional splitting points if the primary separator doesn’t split the text sufficiently
from llama_index.core.node_parser import CodeSplitter
splitter = CodeSplitter(
language="python",
chunk_lines=40, # lines per chunk
chunk_lines_overlap=15, # lines overlap between chunks
max_chars=1500, # max chars per chunk
)
nodes = splitter.get_nodes_from_documents(documents)
3.6.6.4.1.4. Metadata Extraction#
3.6.6.4.1.4.1. Built-in Metadata Extractors#
Use LLMs to automate metadata extraction with our Metadata Extractor modules, following “feature extractors”:
SummaryExtractor
- automatically extracts a summary over a set of NodesQuestionsAnsweredExtractor
- extracts a set of questions that each Node can answerTitleExtractor
- extracts a title over the context of each NodeEntityExtractor
- extracts entities (i.e. names of places, people, things) mentioned in the content of each Node
from llama_index.extractors.entity import EntityExtractor
from llama_index.core.node_parser import SentenceSplitter
entity_extractor = EntityExtractor(
prediction_threshold=0.5,
label_entities=False, # include the entity label in the metadata (can be erroneous)
device="cpu", # set to "cuda" if you have a GPU
)
3.6.6.4.1.4.2. Pydantic Extractor#
Sử dụng Pydantic Extractor để tự động trích xuất metadata từ các Node trong Document. Pydantic Extractor cho phép bạn định nghĩa một mô hình Pydantic và sử dụng nó để trích xuất metadata từ các Node trong Document.
Example guide: Pydantic Extractor
from json import load
from pydantic import BaseModel, Field
from dotenv import load_dotenv
load_dotenv(r"contents/theory/aiml_algorithms/dl_llm/.env")
# Define the metadata model for the node
class NodeMetadata(BaseModel):
"""Node metadata."""
entities: list[str] = Field(..., description="Unique entities in this text chunk.")
summary: str = Field(..., description="A concise summary of this text chunk.")
contains_number: bool = Field(
...,
description=(
"Whether the text chunk contains any numbers (ints, floats, etc.)"
),
)
# Setup the Extractor
from llama_index.program.openai import OpenAIPydanticProgram
from llama_index.core.extractors import PydanticProgramExtractor
from llama_index.llms.openai import OpenAI
EXTRACT_TEMPLATE_STR = """\
Here is the content of the section:
----------------
{context_str}
----------------
Given the contextual information, extract out a {class_name} object.\
"""
openai_program = OpenAIPydanticProgram.from_defaults(
llm=OpenAI(model="gpt-4o-mini"),
output_cls=NodeMetadata,
prompt_template_str="{input}",
extract_template_str=EXTRACT_TEMPLATE_STR,
)
metadata_extractor = PydanticProgramExtractor(
program=openai_program, input_key="input", show_progress=True
)
%pip install -qU llama-index llama-index-readers-web
Note: you may need to restart the kernel to use updated packages.
# load in blog
from llama_index.readers.web import SimpleWebPageReader
reader = SimpleWebPageReader(html_to_text=True)
docs = reader.load_data(urls=["https://eugeneyan.com/writing/llm-patterns/"])
from llama_index.core.node_parser import SentenceSplitter
node_parser = SentenceSplitter(chunk_size=1024)
from llama_index.core.ingestion import IngestionPipeline
import nest_asyncio
nest_asyncio.apply()
pipeline = IngestionPipeline(transformations=[node_parser, metadata_extractor])
orig_nodes = pipeline.run(documents=docs)
orig_nodes
3.6.6.4.1.5. Ingestion Pipeline#
Ingestion Pipeline là một chuỗi các bước xử lý dữ liệu (Transformations
) được apply vào loaded data để chuẩn bị cho việc indexing và querying. Kết quả trả về có thể là Nodes (sau khi được transformed) hoặc Indexes (sau khi được transformed và inserted vào Vector Database)
# Create IngestionPipeline with multiple transformations
from os import wait
from llama_index.core.extractors import (
TitleExtractor,
QuestionsAnsweredExtractor,
)
from llama_index.core.node_parser import TokenTextSplitter
from llama_index.llms.openai import OpenAIEmbedding
from llama_index.core.ingestion import IngestionPipeline
import qdrant_client
# define our pipeline
text_splitter = TokenTextSplitter(separator=" ", chunk_size=512, chunk_overlap=128)
title_extractor = TitleExtractor(nodes=5)
qa_extractor = QuestionsAnsweredExtractor(questions=3)
embedding_model = OpenAIEmbedding() # need stage if using a vector store
# define our vector store
client = qdrant_client.QdrantClient(location=":memory:")
vector_store = QdrantVectorStore(client=client, collection_name="test_store")
pipeline = IngestionPipeline(
transformations=[
text_splitter,
title_extractor,
qa_extractor,
embedding_model,
],
vector_store=vector_store, # optional
)
nodes = pipeline.run(
documents=documents,
in_place=True,
show_progress=True,
num_workers=4, # Set it if run in parallel
)
# nodes = wait pipeline.arun(documents=documents) # async version
nodes
[TextNode(id_='db68033c-8416-43aa-a0b6-6aac294e407a', embedding=None, metadata={'page_label': '1', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\MediaCentre-FunFacts_EN_1.pdf', 'document_title': 'Canada: The Great White North, Green and Blue Wonderland', 'questions_this_excerpt_can_answer': "1. How many caribou are estimated to be living in Canada?\n2. What is the length of Canada's Great Trail, and how does it compare to the Great Wall of China?\n3. What is the postal code for Santa's address in Canada, and why is it significant?"}, excluded_embed_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], excluded_llm_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\MediaCentre-FunFacts_EN_1.pdf_part_0', node_type=<ObjectType.DOCUMENT: '4'>, metadata={'page_label': '1', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\MediaCentre-FunFacts_EN_1.pdf'}, hash='6f4cef12d13b0a7b4db6f9ffa853df65da721d6f9e3e4f3c93197afdff426adc')}, metadata_template='{key}: {value}', metadata_separator='\n', text='We may be known as the Great White North, but we’re also green and blue! Did you know Canada \nhas more lakes than the rest of the world combined and is home to 10% of the world’s forests? \nSome of its national parks are bigger than entire countries! \nWild about wildlife: Canada is home to 2.4 million caribou and 15,500 of the world’s 25,000 polar \nbears, not to mention home to 22 different species of whales. \nCanada’s Great Trail, a network of trails stretching across the country from coast-to-coast-to-coast, \nis the longest recreational trail in the world. At 24,000km of land- and water-based trail, it’s longer \nthan the Great Wall of China (8,851km).\nCanada is made for outdoor adventurers. Did you know you can raft-surf the world’s highest tides \nat the Bay of Fundy, paddle with orcas in British Columbia, track the largest caribou migration in \nNunavut or kayak past icebergs and humpback whales in Newfoundland and Labrador?\nCanada is known as a diverse nation that’s welcoming to immigrants. In 2016, over 250 ethnic \nancestries were reported by the Canadian population, contributing to a rich and vibrant culture and \nculinary scene.\nWell-educated: More than half of Canadians have earned college degrees, making it the world’s \nmost educated nation. \nCanada is home to North America’s only remaining walled city—the historic neighbourhood of \nOld Quebec, also the first city in North America to be placed on UNESCO’s World Heritage Sites list. \nCanada has the world’s most northern settlement: Alert, Nunavut, just shy of the North Pole. That’s \nwhy Santa has his own Canada Post postal code here, (H0H 0H0), where kids can send him letters \nat Christmas (he responds).\nCan you guess Canada’s most played sport? Perhaps a bit surprising, it’s golf, followed by the \nbeloved national pastime, ice hockey. \nFun Facts About Canada', mimetype='text/plain', start_char_idx=0, end_char_idx=1845, metadata_seperator='\n', text_template='[Excerpt from document]\n{metadata_str}\nExcerpt:\n-----\n{content}\n-----\n'),
TextNode(id_='5ca7d422-ad02-4abf-89f5-de027899a699', embedding=None, metadata={'page_label': '2', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\MediaCentre-FunFacts_EN_1.pdf', 'document_title': 'Exploring Canada: A Journey Through Maple Syrup, Doughnuts, Culture, and Beauty', 'questions_this_excerpt_can_answer': "1. What percentage of the world's maple syrup does Canada produce, and where does the majority of it come from?\n2. Which Canadian city has the most doughnut shops per capita in the world, and where is the oldest ballet company in Canada located?\n3. According to Travel + Leisure magazine, what was Canada ranked as in terms of travel destination in 2017, and what were some of the reasons for this ranking?"}, excluded_embed_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], excluded_llm_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\MediaCentre-FunFacts_EN_1.pdf_part_1', node_type=<ObjectType.DOCUMENT: '4'>, metadata={'page_label': '2', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\MediaCentre-FunFacts_EN_1.pdf'}, hash='89bb93f9d3aa95873447df619d76fef16f47fa9e43c878c3c056a7c6c6d8ca69')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Canada produces 70% of the world’s maple syrup — and nearly all of it comes from \nQuebec maples. \nCanadians love their poutine, but are crazy about decadent dough rings! Canada has the most \ndoughnut shops per capita in the world and its people consume the most doughnuts of anywhere \nelse in the world.\nOttawa, Canada’s capital region, houses the country’s most precious cultural treasures. Eight of \nCanada’s nine national museums and galleries are located here. The ninth is the Canadian Museum \nfor Human Rights in Winnipeg, Manitoba.\nCanada is home to the longest running ballet company in North America – the internationally \nrenowned Royal Winnipeg Ballet in Manitoba is the oldest ballet company in Canada. \nCanada is the number 1 travel destination in the world, according to Travel + Leisure magazine \n(2017) (and Lonely Planet), singled out for its unspoiled landscapes, dynamic cities, cultural \ninstitutions and welcoming spirit.\nkeepexploring.ca', mimetype='text/plain', start_char_idx=0, end_char_idx=962, metadata_seperator='\n', text_template='[Excerpt from document]\n{metadata_str}\nExcerpt:\n-----\n{content}\n-----\n'),
TextNode(id_='b9269997-2497-4dd4-848d-a04a78cc8d68', embedding=None, metadata={'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\README.md', 'document_title': 'PDF Sample Files Repository for Testing Software', 'questions_this_excerpt_can_answer': '1. What type of license are the PDF files in this repository under?\n2. How can individuals contribute to this repository?\n3. What information is contained in the `files.json` file provided in this repository?'}, excluded_embed_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], excluded_llm_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\README.md', node_type=<ObjectType.DOCUMENT: '4'>, metadata={'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\README.md'}, hash='31d6394f6dd92d4114920f6aac8ee2a1c7fb21104a6ea0e328bf2e0f8ffc8736')}, metadata_template='{key}: {value}', metadata_separator='\n', text='# PDF Sample Files\n\nThis repository provides files for testing software that reads / parses\nPDF files.\n\nThe `files.json` file contains a list of those PDF files with their metadata.\n\n## Licenses\n\nEvery PDF in this repository is under the Creative Commons\nAttribution-ShareAlike License (CC-BY-SA-4.0).\n\n\n## Contributions\n\nPlease contribute files to fill this repository! Just create a PR with a\nPDF file created by you.', mimetype='text/plain', start_char_idx=0, end_char_idx=419, metadata_seperator='\n', text_template='[Excerpt from document]\n{metadata_str}\nExcerpt:\n-----\n{content}\n-----\n'),
TextNode(id_='93b4e116-7884-4384-a512-38933eb6acc9', embedding=None, metadata={'page_label': '1', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf', 'document_title': 'Comprehensive Guide to Linux System Management, File Handling, Software Installation, Package Management, User Administration, and Tips and Tricks', 'questions_this_excerpt_can_answer': '1. How can you mount a CD-ROM device in Linux and specify a custom name for it under a specific directory?\n2. What command can be used to update the database of files on all file systems attached to the Linux root directory?\n3. How can you list all files in the current directory in long format, indicating the file type and displaying hidden files as well?'}, excluded_embed_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], excluded_llm_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf_part_0', node_type=<ObjectType.DOCUMENT: '4'>, metadata={'page_label': '1', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf'}, hash='9438d9cdc2355857a3c3274a5fe3541da739b575c326d2c6a108cd7feee77eab'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='b193f102-ad06-47ca-9103-13135ea6ec3e', node_type=<ObjectType.TEXT: '1'>, metadata={}, hash='c174a582bd64bea4f33de383288460a94df212d0d80348c7ff385c2ec5220907')}, metadata_template='{key}: {value}', metadata_separator='\n', text='THE ONE PAGE LINUX MANUALA summary of useful Linux commands\nVersion 3.0 May 1999 squadron@powerup.com.au\nStarting & Stopping\nshutdown -h now Shutdown the system now and do not\nreboot\nhalt Stop all processes - same as above\nshutdown -r 5 Shutdown the system in 5 minutes and\nreboot\nshutdown -r now Shutdown the system now and reboot\nreboot Stop all processes and then reboot - same\nas above\nstartx Start the X system\nAccessing & mounting file systems\nmount -t iso9660 /dev/cdrom\n/mnt/cdrom\nMount the device cdrom\nand call it cdrom under the\n/mnt directory\nmount -t msdos /dev/hdd\n/mnt/ddrive\nMount hard disk “d” as a\nmsdos file system and call\nit ddrive under the /mnt\ndirectory\nmount -t vfat /dev/hda1\n/mnt/cdrive\nMount hard disk “a” as a\nVFAT file system and call it\ncdrive under the /mnt\ndirectory\numount /mnt/cdrom Unmount the cdrom\nFinding files and text within files\nfind / -name fname Starting with the root directory, look\nfor the file called fname\nfind / -name ”*fname*” Starting with the root directory, look\nfor the file containing the string fname\nlocate missingfilename Find a file called missingfilename\nusing the locate command - this\nassumes you have already used the\ncommand updatedb (see next)\nupdatedb Create or update the database of files\non all file systems attached to the linux\nroot directory\nwhich missingfilename Show the subdirectory containing the\nexecutable file called missingfilename\ngrep textstringtofind\n/dir\nStarting with the directory called dir ,\nlook for and list all files containing\ntextstringtofind\nThe X Window System\nxvidtune Run the X graphics tuning utility\nXF86Setup Run the X configuration menu with\nautomatic probing of graphics cards\nXconfigurator Run another X configuration menu with\nautomatic probing of graphics cards\nxf86config Run a text based X configuration menu\nMoving, copying, deleting & viewing files\nls -l List files in current directory using\nlong format\nls -F List files in current directory and\nindicate the file type\nls -laC List all files in current', mimetype='text/plain', start_char_idx=0, end_char_idx=2019, metadata_seperator='\n', text_template='[Excerpt from document]\n{metadata_str}\nExcerpt:\n-----\n{content}\n-----\n'),
TextNode(id_='b193f102-ad06-47ca-9103-13135ea6ec3e', embedding=None, metadata={'page_label': '1', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf', 'document_title': 'Comprehensive Guide to Linux System Management, File Handling, Software Installation, Package Management, User Administration, and Tips and Tricks', 'questions_this_excerpt_can_answer': '1. How can you list all files containing a specific text string in a directory using Linux commands?\n2. What command can be used to remove an entire directory and all its contents in Linux?\n3. How can you decompress files contained in a zipped and tarred archive using Linux commands?'}, excluded_embed_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], excluded_llm_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf_part_0', node_type=<ObjectType.DOCUMENT: '4'>, metadata={'page_label': '1', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf'}, hash='9438d9cdc2355857a3c3274a5fe3541da739b575c326d2c6a108cd7feee77eab'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='93b4e116-7884-4384-a512-38933eb6acc9', node_type=<ObjectType.TEXT: '1'>, metadata={'page_label': '1', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf'}, hash='3a95c524017de85cd87591303fea9e08022dfafecc8f93cde407cfa2a03f4b31'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='4fc6fea7-e4a8-4245-92fe-e91f38be726b', node_type=<ObjectType.TEXT: '1'>, metadata={}, hash='d8c096b0a310d71743f5564e9de87047f05e0f8bd473899765f851b7c82f41fa')}, metadata_template='{key}: {value}', metadata_separator='\n', text='with the directory called dir ,\nlook for and list all files containing\ntextstringtofind\nThe X Window System\nxvidtune Run the X graphics tuning utility\nXF86Setup Run the X configuration menu with\nautomatic probing of graphics cards\nXconfigurator Run another X configuration menu with\nautomatic probing of graphics cards\nxf86config Run a text based X configuration menu\nMoving, copying, deleting & viewing files\nls -l List files in current directory using\nlong format\nls -F List files in current directory and\nindicate the file type\nls -laC List all files in current directory in\nlong format and display in columns\nrm name Remove a file or directory called\nname\nrm -rf name Kill off an entire directory and all it’s\nincludes files and subdirectories\ncp filename\n/home/dirname\nCopy the file called filename to the\n/home/dirname directory\nmv filename\n/home/dirname\nMove the file called filename to the\n/home/dirname directory\ncat filetoview Display the file called filetoview\nman -k keyword Display man pages containing\nkeyword\nmore filetoview Display the file called filetoview one\npage at a time, proceed to next page\nusing the spacebar\nhead filetoview Display the first 10 lines of the file\ncalled filetoview\nhead -20 filetoview Display the first 20 lines of the file\ncalled filetoview\ntail filetoview Display the last 10 lines of the file\ncalled filetoview\ntail -20 filetoview Display the last 20 lines of the file\ncalled filetoview\nInstalling software for Linux\nrpm -ihv name.rpm Install the rpm package called name\nrpm -Uhv name.rpm Upgrade the rpm package called\nname\nrpm -e package Delete the rpm package called\npackage\nrpm -l package List the files in the package called\npackage\nrpm -ql package List the files and state the installed\nversion of the package called\npackage\nrpm -i --force package Reinstall the rpm package called\nname having deleted parts of it (not\ndeleting using rpm -e)\ntar -zxvf archive.tar.gz or\ntar -zxvf archive.tgz\nDecompress the files contained in\nthe zipped and tarred archive called\narchive\n./configure Execute the script preparing the\ninstalled files for', mimetype='text/plain', start_char_idx=1455, end_char_idx=3541, metadata_seperator='\n', text_template='[Excerpt from document]\n{metadata_str}\nExcerpt:\n-----\n{content}\n-----\n'),
TextNode(id_='4fc6fea7-e4a8-4245-92fe-e91f38be726b', embedding=None, metadata={'page_label': '1', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf', 'document_title': 'Comprehensive Guide to Linux System Management, File Handling, Software Installation, Package Management, User Administration, and Tips and Tricks', 'questions_this_excerpt_can_answer': '1. How can you reinstall an rpm package in Linux without deleting it using the rpm -e command?\n2. What command can you use to list the files and state the installed version of a specific rpm package in Linux?\n3. How can you execute a script to prepare installed files for compiling in Linux?'}, excluded_embed_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], excluded_llm_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf_part_0', node_type=<ObjectType.DOCUMENT: '4'>, metadata={'page_label': '1', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf'}, hash='9438d9cdc2355857a3c3274a5fe3541da739b575c326d2c6a108cd7feee77eab'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='b193f102-ad06-47ca-9103-13135ea6ec3e', node_type=<ObjectType.TEXT: '1'>, metadata={'page_label': '1', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf'}, hash='ba06ced564bb0eacd29920ed80204bf3705c52795dde19d9b1d4b49be05c4e13')}, metadata_template='{key}: {value}', metadata_separator='\n', text='rpm package called\nname\nrpm -e package Delete the rpm package called\npackage\nrpm -l package List the files in the package called\npackage\nrpm -ql package List the files and state the installed\nversion of the package called\npackage\nrpm -i --force package Reinstall the rpm package called\nname having deleted parts of it (not\ndeleting using rpm -e)\ntar -zxvf archive.tar.gz or\ntar -zxvf archive.tgz\nDecompress the files contained in\nthe zipped and tarred archive called\narchive\n./configure Execute the script preparing the\ninstalled files for compiling\nUser Administration\nadduser accountname Create a new user call accountname\npasswd accountname Give accountname a new password\nsu Log in as superuser from current login\nexit Stop being superuser and revert to\nnormal user\nLittle known tips and tricks\nifconfig List ip addresses for all devices on\nthe machine\napropos subject List manual pages for subject\nusermount Executes graphical application for\nmounting and unmounting file\nsystems', mimetype='text/plain', start_char_idx=3002, end_char_idx=3986, metadata_seperator='\n', text_template='[Excerpt from document]\n{metadata_str}\nExcerpt:\n-----\n{content}\n-----\n'),
TextNode(id_='8d15d2b1-f192-4a07-b6bf-1a67d0ccdbbd', embedding=None, metadata={'page_label': '2', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf', 'document_title': 'Comprehensive Guide to Linux System Administration and Maintenance Commands, Configuration, Window Management, and Printing', 'questions_this_excerpt_can_answer': '1. What is the purpose of the /etc/fstab file in Linux system administration and maintenance?\n2. How can a user start in single user mode at the lilo prompt in Linux, and why is this useful?\n3. What information is typically contained in the /etc/hosts file on a Linux machine, and why is it important for network communication?'}, excluded_embed_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], excluded_llm_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf_part_1', node_type=<ObjectType.DOCUMENT: '4'>, metadata={'page_label': '2', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf'}, hash='9c402e8b0cfcdc404a4bedc312c2b8dc624987079092fbd856c18a639dcf294a'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='8733c086-51b2-4f92-9c2c-417de4374f49', node_type=<ObjectType.TEXT: '1'>, metadata={}, hash='26a98600aa9c662a7940cbeaed3856df1bfbae0e96c2c45fcf64d143ad661625')}, metadata_template='{key}: {value}', metadata_separator='\n', text='/sbin/e2fsck hda5 Execute the filesystem check utility\non partition hda5\nfdformat /dev/fd0H1440 Format the floppy disk in device fd0\ntar -cMf /dev/fd0 Backup the contents of the current\ndirectory and subdirectories to\nmultiple floppy disks\ntail -f /var/log/messages Display the last 10 lines of the system\nlog.\ncat /var/log/dmesg Display the file containing the boot\ntime messages - useful for locating\nproblems. Alternatively, use the\ndmesg command.\n* wildcard - represents everything. eg.\ncp from/* to will copy all files in the\nfrom directory to the to directory\n? Single character wildcard. eg.\ncp config.? /configs will copy all files\nbeginning with the name config. in\nthe current directory to the directory\nnamed configs.\n[xyz] Choice of character wildcards. eg.\nls [xyz]* will list all files in the current\ndirectory starting with the letter x, y,\nor z.\nlinux single At the lilo prompt, start in single user\nmode. This is useful if you have\nforgotten your password. Boot in\nsingle user mode, then run the\npasswd command.\nps List current processes\nkill 123 Kill a specific process eg. kill 123\nConfiguration files and what they do\n/etc/profile System wide environment variables for\nall users.\n/etc/fstab List of devices and their associated mount\npoints. Edit this file to add cdroms, DOS\npartitions and floppy drives at startup.\n/etc/motd Message of the day broadcast to all users\nat login.\netc/rc.d/rc.local Bash script that is executed at the end of\nlogin process. Similar to autoexec.bat in\nDOS.\n/etc/HOSTNAME Conatins full hostname including domain.\n/etc/cron.* There are 4 directories that automatically\nexecute all scripts within the directory at\nintervals of hour, day, week or month.\n/etc/hosts A list of all know host names and IP\naddresses on the machine.\n/etc/httpd/conf Paramters for the Apache web server\n/etc/inittab Specifies the run level that the machine\nshould boot into.\n/etc/resolv.conf Defines IP addresses of DNS servers.\n/etc/smb.conf Config file for the SAMBA server. Allows\nfile and print sharing with Microsoft\nclients.\n/etc/X11/XF86Confi\ng\nConfig file', mimetype='text/plain', start_char_idx=0, end_char_idx=2087, metadata_seperator='\n', text_template='[Excerpt from document]\n{metadata_str}\nExcerpt:\n-----\n{content}\n-----\n'),
TextNode(id_='8733c086-51b2-4f92-9c2c-417de4374f49', embedding=None, metadata={'page_label': '2', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf', 'document_title': 'Comprehensive Guide to Linux System Administration and Maintenance Commands, Configuration, Window Management, and Printing', 'questions_this_excerpt_can_answer': '1. What are the different directories in Linux that automatically execute scripts at intervals of hour, day, week, or month?\n2. How can file permissions be altered in Linux using the chmod command and octal codes for different user types?\n3. What are some X Shortcuts specific to Redhat Linux, such as increasing screen resolution, displaying active windows, and starting an xterm session?'}, excluded_embed_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], excluded_llm_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf_part_1', node_type=<ObjectType.DOCUMENT: '4'>, metadata={'page_label': '2', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf'}, hash='9c402e8b0cfcdc404a4bedc312c2b8dc624987079092fbd856c18a639dcf294a'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='8d15d2b1-f192-4a07-b6bf-1a67d0ccdbbd', node_type=<ObjectType.TEXT: '1'>, metadata={'page_label': '2', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf'}, hash='d23f9fcf6ff56a600cd9aaff42acd247b80ca27e090a3982bc01c19b6bcd89d0'), <NodeRelationship.NEXT: '3'>: RelatedNodeInfo(node_id='847ea99c-dfac-4826-9fd4-468bb693a55c', node_type=<ObjectType.TEXT: '1'>, metadata={}, hash='f27122aa9d574c0157ecca7aefccac000138239d2b3d868146fc42dcc4700f57')}, metadata_template='{key}: {value}', metadata_separator='\n', text='hostname including domain.\n/etc/cron.* There are 4 directories that automatically\nexecute all scripts within the directory at\nintervals of hour, day, week or month.\n/etc/hosts A list of all know host names and IP\naddresses on the machine.\n/etc/httpd/conf Paramters for the Apache web server\n/etc/inittab Specifies the run level that the machine\nshould boot into.\n/etc/resolv.conf Defines IP addresses of DNS servers.\n/etc/smb.conf Config file for the SAMBA server. Allows\nfile and print sharing with Microsoft\nclients.\n/etc/X11/XF86Confi\ng\nConfig file for X-Windows.\n~/.xinitrc Defines the windows manager loaded by\nX. ~ refers to user’s home directory.\nFile permissions\nIf the command ls -l is given, a long list of file names is\ndisplayed. The first column in this list details the permissions\napplying to the file. If a permission is missing for a owner,\ngroup of other, it is represented by - eg. drwxr-x—x\nRead = 4\nWrite = 2\nExecute = 1\nFile permissions are altered by giving the\nchmod command and the appropriate\noctal code for each user type. eg\nchmod 7 6 4 filename will make the file\ncalled filename R+W+X for the owner,\nR+W for the group and R for others.\nchmod 7 5 5 Full permission for the owner, read and\nexecute access for the group and others.\nchmod +x filename Make the file called filename executable\nto all users.\nX Shortcuts - (mainly for Redhat)\nControl|Alt + or - Increase or decrease the screen\nresolution. eg. from 640x480 to\n800x600\nAlt | escape Display list of active windows\nShift|Control F8 Resize the selected window\nRight click on desktop\nbackground\nDisplay menu\nShift|Control Altr Refresh the screen\nShift|Control Altx Start an xterm session\nPrinting\n/etc/rc.d/init.d/lpd start Start the print daemon\n/etc/rc.d/init.d/lpd stop Stop the print daemon\n/etc/rc.d/init.d/lpd\nstatus\nDisplay status of the print daemon\nlpq Display jobs in print queue\nlprm Remove jobs from queue\nlpr Print a file\nlpc Printer control tool\nman subject | lpr Print the manual page called', mimetype='text/plain', start_char_idx=1536, end_char_idx=3528, metadata_seperator='\n', text_template='[Excerpt from document]\n{metadata_str}\nExcerpt:\n-----\n{content}\n-----\n'),
TextNode(id_='847ea99c-dfac-4826-9fd4-468bb693a55c', embedding=None, metadata={'page_label': '2', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf', 'document_title': 'Comprehensive Guide to Linux System Administration and Maintenance Commands, Configuration, Window Management, and Printing', 'questions_this_excerpt_can_answer': '1. How can you display a list of active windows in Linux?\n2. What command can you use to start and stop the print daemon in Linux?\n3. How can you print a file in Linux using the command line?'}, excluded_embed_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], excluded_llm_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf_part_1', node_type=<ObjectType.DOCUMENT: '4'>, metadata={'page_label': '2', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf'}, hash='9c402e8b0cfcdc404a4bedc312c2b8dc624987079092fbd856c18a639dcf294a'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='8733c086-51b2-4f92-9c2c-417de4374f49', node_type=<ObjectType.TEXT: '1'>, metadata={'page_label': '2', 'file_name': 'c:\\Users\\datkt\\Desktop\\Working\\notebooks\\coding\\learning\\contents\\theory\\aiml_algorithms\\dl_llm\\data\\The One Page Linux Manual.pdf'}, hash='145cc33ed87f621ecb6c14b80cc10517fdd64c82c3f0e5f0b4e5fa569cc60df9')}, metadata_template='{key}: {value}', metadata_separator='\n', text='Display list of active windows\nShift|Control F8 Resize the selected window\nRight click on desktop\nbackground\nDisplay menu\nShift|Control Altr Refresh the screen\nShift|Control Altx Start an xterm session\nPrinting\n/etc/rc.d/init.d/lpd start Start the print daemon\n/etc/rc.d/init.d/lpd stop Stop the print daemon\n/etc/rc.d/init.d/lpd\nstatus\nDisplay status of the print daemon\nlpq Display jobs in print queue\nlprm Remove jobs from queue\nlpr Print a file\nlpc Printer control tool\nman subject | lpr Print the manual page called subject\nas plain text\nman -t subject | lpr Print the manual page called subject\nas Postscript output\nprinttool Start X printer setup interface\n~/.Xdefaults Define configuration for some X-\napplications. ~ refers to user’s home\ndirectory.\nGet your own Official Linux Pocket Protector - includes\nhandy command summary. Visit:\nwww.powerup.com.au/~squadron', mimetype='text/plain', start_char_idx=3008, end_char_idx=3881, metadata_seperator='\n', text_template='[Excerpt from document]\n{metadata_str}\nExcerpt:\n-----\n{content}\n-----\n')]
# OR create in INDEXING PIPELINE
from llama_index.core import VectorStoreIndex
index = VectorStoreIndex.from_documents(
documents, transformations=[text_splitter, title_extractor, qa_extractor]
)
3.6.6.4.1.5.1. Caching#
Caching (lưu trữ tạm) trong IngestionPipeline của LlamaIndex là một cơ chế để lưu lại kết quả của việc áp dụng một biến đổi (transformation) cụ thể lên một nút (node) dữ liệu cụ thể, giúp tiết kiệm thời gian và chi phí khi chạy pipeline nhiều lần hoặc với dữ liệu không thay đổi.
Cách hoạt động của caching:
Tạo Hash (Băm): Khi một nút dữ liệu (có thể là tài liệu gốc hoặc kết quả từ bước trước đó) được xử lý bởi một bước biến đổi (transformation), LlamaIndex sẽ tạo ra một giá trị định danh duy nhất (gọi là hash) dựa trên nội dung của nút đó và cấu hình của bước biến đổi đó.
Kiểm tra Cache: Trước khi thực sự thực hiện biến đổi, pipeline sẽ kiểm tra xem trong bộ nhớ cache đã có kết quả nào ứng với giá trị hash này chưa.
Sử dụng Cache (Cache Hit): Nếu đã có kết quả trong cache (cache hit), pipeline sẽ lấy luôn kết quả đó và chuyển sang bước tiếp theo mà không cần thực hiện lại việc biến đổi.
Thực hiện và Lưu Cache (Cache Miss): Nếu chưa có kết quả trong cache (cache miss), pipeline sẽ thực hiện bước biến đổi đó, sau đó lưu kết quả vào cache cùng với giá trị hash tương ứng, rồi mới sử dụng kết quả đó cho bước tiếp theo.
Lợi ích chính:
Tiết kiệm thời gian: Quan trọng nhất, caching giúp tiết kiệm đáng kể thời gian xử lý, đặc biệt khi bạn chạy pipeline nhiều lần với cùng một dữ liệu đầu vào hoặc khi chỉ có một phần nhỏ dữ liệu thay đổi. Pipeline sẽ bỏ qua các bước đã được thực hiện và lưu cache trước đó.
Tiết kiệm chi phí: Nếu các bước biến đổi có sử dụng API tốn phí (như
OpenAIEmbedding
), caching giúp tránh gọi lại các API này cho cùng một dữ liệu, từ đó giảm chi phí.
Quản lý Cache:
Có hai cách quản lý cache:
Local Cache Management (Quản lý Cache Cục bộ):
Cache được lưu trữ trên máy cục bộ (có thể trong bộ nhớ hoặc file).
Bạn có thể lưu cache ra đĩa để sử dụng sau (
pipeline.persist("./pipeline_storage")
).Bạn có thể tải lại cache đã lưu (
new_pipeline.load("./pipeline_storage")
).Bạn có thể xóa toàn bộ nội dung cache nếu nó quá lớn (
cache.clear()
).
Remote Cache Management (Quản lý Cache Từ xa):
Cache được lưu trữ trên các hệ thống bên ngoài như Redis, MongoDB, Firestore.
Tiện lợi khi chạy pipeline trên nhiều máy hoặc muốn chia sẻ cache.
Không cần bước
persist
riêng vì dữ liệu được lưu vào hệ thống từ xa ngay khi được tạo ra.Cần cấu hình kết nối đến hệ thống lưu trữ (ví dụ:
RedisCache.from_host_and_port(...)
).
Các trường hợp cần sử dụng caching:
Phát triển và Gỡ lỗi (Development & Debugging):
Khi bạn đang xây dựng hoặc tinh chỉnh pipeline, bạn sẽ phải chạy đi chạy lại rất nhiều lần để kiểm tra. Có thể bạn chỉ thay đổi một tham số nhỏ trong một bước biến đổi (ví dụ:
chunk_size
từ 25 thành 50), hoặc thêm/bớt một bước.-> Thay vì phải xử lý lại toàn bộ dữ liệu từ đầu chỉ vì một thay đổi nhỏ, cache cho phép pipeline bỏ qua tất cả các bước không thay đổi cho những dữ liệu không thay đổi. Nó chỉ tính toán lại những phần bị ảnh hưởng bởi sự thay đổi của bạn. Điều này tăng tốc độ chu kỳ phát triển lên rất nhiều.
Cập nhật Dữ liệu Tăng cường (Incremental Updates):
Hệ thống của bạn thường xuyên có dữ liệu mới (ví dụ: bài viết blog mới, tài liệu mới, sản phẩm mới). Bạn cần chạy pipeline để xử lý những dữ liệu mới này
-> Mặc dù mục tiêu chính là xử lý dữ liệu mới, nhưng khi bạn gọi
pipeline.run()
, có thể bạn cung cấp một tập hợp chứa cả dữ liệu cũ và mới, hoặc pipeline được thiết kế để quét qua toàn bộ nguồn dữ liệu. Cache đảm bảo rằng những tài liệu cũ, không thay đổi sẽ không bị xử lý lại một cách không cần thiết, giúp việc cập nhật nhanh hơn và chỉ tập trung vào phần dữ liệu mới.Thay đổi Cấu hình Pipeline (Pipeline Configuration Changes):
Sau một thời gian, bạn có thể quyết định thay đổi cách xử lý dữ liệu. Ví dụ: đổi sang một mô hình embedding tốt hơn, thay đổi chiến lược tách câu, hoặc thêm một bước trích xuất metadata mới
-> Khi bạn chạy lại pipeline với cấu hình mới này trên toàn bộ dữ liệu, cache vẫn phát huy tác dụng cho những bước không bị thay đổi. Ví dụ, nếu bạn chỉ thay đổi mô hình embedding ở cuối pipeline, các bước như tách câu, trích xuất tiêu đề (nếu có) đã được cache trước đó sẽ được bỏ qua, tiết kiệm thời gian đáng kể.
Lỗi và Khôi phục (Failures and Recovery):
Một pipeline xử lý lượng lớn dữ liệu có thể chạy trong thời gian dài và có thể bị lỗi giữa chừng (do hết bộ nhớ, lỗi mạng khi gọi API, v.v.)
-> Khi bạn khởi động lại pipeline sau lỗi, cache giúp nó “nhớ” được những phần công việc đã hoàn thành và được lưu lại. Pipeline có thể nhanh chóng bỏ qua các bước đã cache và tiếp tục từ điểm gần nhất trước khi xảy ra lỗi, thay vì phải bắt đầu lại từ đầu (Đặc biệt là Remote Cache).
Tái sử dụng và Chạy song song (Reusability and Parallel Runs):
Bạn có thể muốn tái sử dụng một phần của pipeline cho các mục đích khác nhau, hoặc chạy nhiều phiên bản pipeline song song
->: Một bộ cache chung (như Redis) cho phép các tiến trình hoặc worker khác nhau chia sẻ kết quả. Nếu hai worker tình cờ cùng xử lý một đoạn dữ liệu giống nhau ở một bước nào đó, chỉ một worker cần thực hiện tính toán, worker còn lại có thể lấy kết quả từ cache.
# Local Cache Management
# save pipeline cache in local storage
pipeline.persist("./pipeline_storage")
# load and restore state (new pipeline)
new_pipeline = IngestionPipeline(
transformations=[
SentenceSplitter(chunk_size=25, chunk_overlap=0),
TitleExtractor(),
],
)
# load the pipeline state from local cache
new_pipeline.load("./pipeline_storage")
# will run instantly due to the cache
nodes = pipeline.run(documents=[Document.example()])
# Remote Cache Management: RedisCache, MongoDBCache, FirestoreCache
from llama_index.core import Document
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.core.node_parser import SentenceSplitter
from llama_index.core.extractors import TitleExtractor
from llama_index.core.ingestion import IngestionPipeline, IngestionCache
from llama_index.storage.kvstore.redis import RedisKVStore as RedisCache
ingest_cache = IngestionCache(
cache=RedisCache.from_host_and_port(host="127.0.0.1", port=6379),
collection="my_test_cache",
)
pipeline = IngestionPipeline(
transformations=[
SentenceSplitter(chunk_size=25, chunk_overlap=0),
TitleExtractor(),
OpenAIEmbedding(),
],
cache=ingest_cache,
)
# Ingest directly into a vector db
nodes = pipeline.run(documents=[Document.example()])
# delete all context of the cache If the cache becomes too large
ingest_cache.clear()
3.6.6.4.2. Indexing & Embedding#
Indexes: Khi data được ingested, nó sẽ được chuyển đổi thành 1 structure data được gọi là Indexes (bao gồm data được vector embedding + metadata) để dễ dàng retrieve và query, được lưu trữ trong một cơ sở dữ liệu vector (vector store) và được design để tối ưu hóa cho việc truy vấn và tìm kiếm thông tin.
Nodes (Nút):
Miêu tả: Trong LlamaIndex, một
Node
cơ bản là một chunk văn bản được trích ra từ mộtDocument
gốc lớn hơn. Khi bạn đưa các đối tượngDocument
vào LlamaIndex, nó sẽ tự động thực hiện việc phân tích và chia nhỏ các tài liệu đó thành cácNode
. MỗiNode
không chỉ chứa đoạn văn bản mà còn có thể chứa metadata quan trọng như ID củaDocument
gốc, mối quan hệ với các Node khác, v.v. Việc chia nhỏ này giúp xử lý các tài liệu lớn dễ dàng hơn, đặc biệt là khi đưa vào LLM vốn có giới hạn về ngữ cảnh (context window).Vai trò: Nodes là đơn vị cơ bản mà các Index lưu trữ và quản lý. Khi bạn truy vấn, Index sẽ tìm và trả về các Nodes phù hợp nhất.
Response Synthesis (Tổng hợp Phản hồi):
Miêu tả: Đây là một module có nhiệm vụ nhận các
Node
đã được truy xuất từ một Index (dựa trên câu truy vấn của user) và tạo ra một câu trả lời cuối cùng, mạch lạc và tự nhiên cho người dùng. Module này thường sử dụng một LLM để thực hiện việc tổng hợp này.Vai trò: Sau khi Index đã tìm ra các Nodes liên quan nhất đến câu hỏi,
Response Synthesis
sẽ “lắp ráp” các mảnh đó lại, có thể là tóm tắt, trích xuất thông tin cụ thể, hoặc kết hợp chúng để đưa ra câu trả lời hoàn chỉnh. LlamaIndex cung cấp nhiều “chế độ phản hồi” (response modes) khác nhau để kiểm soát cách LLM sử dụng các Node được truy xuất (ví dụ: tóm tắt lần lượt, xây dựng câu trả lời dựa trên tất cả các node cùng lúc, v.v.).Check Response Mode để biết thêm chi tiết.
3.6.6.4.2.1. SummaryIndex#


Miêu tả: Đây là loại Index đơn giản nhất. Nó lưu trữ các Nodes theo tuần tự, giống như một danh sách. Nó phù hợp cho việc tóm tắt toàn bộ nội dung của các tài liệu hoặc trả lời các câu hỏi yêu cầu xem xét tổng thể tất cả thông tin.
Khi truy vấn (Query): Thường thì Index này sẽ tải tất cả các Nodes (hoặc một phần lớn nếu cấu hình) vào cửa sổ ngữ cảnh của LLM và yêu cầu LLM tổng hợp câu trả lời dựa trên toàn bộ thông tin đó. Cách này có thể không hiệu quả với lượng dữ liệu lớn do giới hạn ngữ cảnh và chi phí LLM. Thường dùng với
response_mode="tree_summarize"
để xử lý nhiều nodes hiệu quả hơn.
from llama_index.core import SummaryIndex
from llama_index.core import Document
from llama_index.llms.openai import OpenAI
# Load documents
docs = [
Document(
text="This is a sample document text",
metadata={"filename": "sample.txt"},
),
Document(
text="This is another sample document text",
metadata={"filename": "sample2.txt"},
),
]
# Create a SummaryIndex from the documents
index = SummaryIndex.from_documents(docs)
# Query the index
query_engine = index.as_query_engine(llm=OpenAI(model="gpt-4o-mini"))
response = query_engine.query("What is the sample document text?")
print(response)
The sample document text is "This is a sample document text."
3.6.6.4.2.2. DocumentSummaryIndex#
Miêu tả: Được thiết kế đặc biệt để xử lý các bộ sưu tập tài liệu rất lớn. Index này tạo ra một bản tóm tắt cho mỗi tài liệu (hoặc nhóm tài liệu) trước, sau đó xây dựng một index khác (thường là VectorStoreIndex) trên các bản tóm tắt này.
Khi truy vấn (Query): Đầu tiên, truy vấn sẽ tìm kiếm các bản tóm tắt phù hợp nhất. Sau đó, dựa trên các bản tóm tắt được chọn, nó có thể tùy chọn truy xuất các Nodes gốc tương ứng nếu cần thêm chi tiết. Cuối cùng, Response Synthesis sẽ tạo câu trả lời dựa trên các bản tóm tắt (và có thể cả Nodes gốc). Rất hiệu quả cho các câu hỏi về nội dung tổng quan của nhiều tài liệu.
from llama_index.core import SimpleDirectoryReader, get_response_synthesizer
from llama_index.core import DocumentSummaryIndex
from llama_index.llms.openai import OpenAI
from llama_index.core.node_parser import SentenceSplitter
chatgpt = OpenAI(
model="gpt-4o-mini",
temperature=0.2,
max_tokens=50,
additional_kwargs={"seed": 12345678, "top_p": 0.5},
)
# default mode of building the index
splitter = SentenceSplitter(chunk_size=1024)
response_synthesizer = get_response_synthesizer(
llm=chatgpt, response_mode="tree_summarize", use_async=True
)
doc_summary_index = DocumentSummaryIndex.from_documents(
docs,
llm=chatgpt,
transformations=[splitter],
response_synthesizer=response_synthesizer,
show_progress=True,
)
3.6.6.4.2.3. VectorStoreIndex#


Miêu tả: Đây là loại Index phổ biến và mạnh mẽ nhất. Mỗi Node được chuyển đổi thành một vector số học (embedding) bằng một mô hình embedding. Các vector này được lưu trữ trong một cơ sở dữ liệu vector (vector store). Các Nodes có nội dung ngữ nghĩa tương tự nhau sẽ có vector nằm gần nhau trong không gian vector.
Khi truy vấn (Query): Câu truy vấn của người dùng cũng được chuyển đổi thành một vector embedding. Index sẽ tìm kiếm trong vector store để xác định các Nodes có vector gần nhất (tương tự nhất về ngữ nghĩa) với vector của câu truy vấn (thường dùng thuật toán như cosine similarity, k-nearest neighbors - KNN). Các Nodes liên quan nhất này (top-k) sau đó được đưa vào Response Synthesis để tạo câu trả lời. Rất tốt cho tìm kiếm ngữ nghĩa (semantic search) và trả lời câu hỏi dựa trên sự liên quan về ý nghĩa.
Top-k: Số lượng nodes được truy xuất từ vector store. Thường dùng
top_k=3
hoặctop_k=5
để đảm bảo độ chính xác và hiệu suất tốt nhất.
High-level
from llama_index.core import VectorStoreIndex
index = VectorStoreIndex.from_documents(documents)
# or
index = VectorStoreIndex(nodes)
Low-level
from llama_index.core import Document
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.core.node_parser import SentenceSplitter
from llama_index.core.extractors import TitleExtractor
from llama_index.core.ingestion import IngestionPipeline, IngestionCache
import pinecone
from llama_index import VectorStoreIndex, SimpleDirectoryReader, StorageContext
from llama_index.vector_stores import PineconeVectorStore
import nest_asyncio
nest_asyncio.apply()
doc = Document.example()
# create the pipeline with transformations
pipeline = IngestionPipeline(
transformations=[
SentenceSplitter(chunk_size=100, chunk_overlap=0),
TitleExtractor(),
OpenAIEmbedding(model="text-embedding-3-small"),
]
)
# run the pipeline
nodes = pipeline.run(documents=[doc])
# Initialize Pinecone vector store
pinecone.init(
api_key="your-api-key", # replace with your Pinecone API key
environment="your-environment", # replace with your Pinecone environment
)
# Create or get an existing index
index_name = "llamaindex-demo"
if index_name not in pinecone.list_indexes():
pinecone.create_index(
name=index_name,
dimension=1536, # OpenAI embedding dimension
metric="cosine",
)
# Initialize the Pinecone vector store
pinecone_index = pinecone.Index(index_name)
vector_store = PineconeVectorStore(pinecone_index=pinecone_index)
# Create storage context
storage_context = StorageContext.from_defaults(vector_store=vector_store)
# Create the vector store index using the nodes from the pipeline
vector_index = VectorStoreIndex(nodes, storage_context=storage_context)
# Create a query engine
query_engine = vector_index.as_query_engine()
# Query the index
response = query_engine.query("What is LlamaIndex used for?")
print(response)
3.6.6.4.2.4. KeywordTableIndex#


Miêu tả: Index này trích xuất các từ khóa (keywords) quan trọng từ mỗi Node và xây dựng một bảng ánh xạ (giống như hash map hoặc dictionary) từ các từ khóa đến danh sách các Nodes chứa từ khóa đó.
Khi truy vấn (Query): Các từ khóa cũng được trích xuất từ câu truy vấn. Index sử dụng các từ khóa này để tra cứu nhanh trong bảng và tìm ra các Nodes có chứa chúng. Phù hợp cho các truy vấn mà từ khóa cụ thể là yếu tố quyết định. Thường kém hiệu quả hơn VectorStoreIndex trong việc tìm kiếm theo ngữ nghĩa (khi từ ngữ trong câu hỏi và tài liệu khác nhau nhưng cùng ý). Đôi khi được kết hợp với VectorStoreIndex.
3.6.6.4.2.5. TreeIndex#


Miêu tả: Xây dựng một cấu trúc dữ liệu dạng cây (tree) từ các Nodes. Các Node cha trong cây thường là bản tóm tắt nội dung của các Node con của nó. Các Node lá (leaf nodes) chứa các đoạn văn bản gốc.
Khi truy vấn (Query): Truy vấn bắt đầu từ gốc của cây. Tại mỗi Node cha, LLM sẽ được sử dụng để quyết định Node con nào là liên quan nhất đến câu hỏi dựa trên nội dung tóm tắt của Node cha. Quá trình này lặp lại, đi sâu dần xuống cây cho đến khi đến được các Node lá chứa thông tin chi tiết cần thiết. Phù hợp cho việc tóm tắt có cấu trúc và trả lời các câu hỏi yêu cầu khám phá thông tin theo kiểu phân cấp.
Ứng dụng: Phù hợp với Summarization Tasks
3.6.6.4.2.6. KnowledgeGraphIndex#
(Property Graph Index)
Miêu tả: Các index này (thường được gọi chung là Knowledge Graph Index - Chỉ mục Đồ thị Tri thức) trích xuất các thực thể (Entities - ví dụ: người, địa điểm, tổ chức, khái niệm) và mối quan hệ (Relationships) giữa chúng từ văn bản để xây dựng một đồ thị tri thức có cấu trúc. Nodes trong đồ thị đại diện cho thực thể, và các cạnh (edges) đại diện cho mối quan hệ (ví dụ: “Nhân viên A” –
làm việc tại
–> “Công ty B”).Khi truy vấn (Query): Truy vấn có thể là việc tìm kiếm các thực thể/mối quan hệ cụ thể hoặc thực hiện các thao tác duyệt đồ thị (graph traversal) để khám phá các kết nối phức tạp (ví dụ: “Ai làm việc tại Công ty B?”, “Những công ty nào liên quan đến công nghệ AI?”). Nó cho phép trả lời các câu hỏi phức tạp về mối liên hệ trong dữ liệu mà các loại index khác có thể bỏ lỡ. Thường bao gồm việc chuyển đổi câu hỏi ngôn ngữ tự nhiên thành một truy vấn đồ thị (như Cypher, SPARQL) hoặc dùng LLM để suy luận trực tiếp trên cấu trúc đồ thị.
Ứng dụng: Phù hợp với với Question Answering Tasks với yêu cầu cao về độ phức tạp và data cần liên kết chặt chẽ với nhau (ví dụ như Luật, Tài chính, Y tế, v.v.)
3.6.6.4.2.7. ComposableGraphIndex#
Miêu tả: Đây không phải là một loại index cụ thể mà là một cơ chế cho phép kết hợp nhiều index lại với nhau (có thể là các index cùng loại hoặc khác loại). Ví dụ, bạn có thể tạo một index tóm tắt cấp cao để định tuyến (route) truy vấn đến các VectorStoreIndex khác nhau tùy thuộc vào loại tài liệu, hoặc kết hợp KeywordTableIndex để lọc bước đầu rồi mới tìm kiếm trên VectorStoreIndex.
Khi truy vấn (Query): Truy vấn đầu tiên sẽ được gửi đến index “cha” hoặc “điểm vào” trong cấu trúc kết hợp. Index này sẽ dùng logic riêng (hoặc LLM) để quyết định index con nào phù hợp nhất để xử lý truy vấn. Sau đó, truy vấn được chuyển tiếp đến index con tương ứng. Kết quả từ các index con có thể được tổng hợp lại ở cấp cao hơn trước khi đưa vào Response Synthesis. Nó cho phép xây dựng các chiến lược truy xuất phức tạp và đa tầng.
Ứng dụng: Phù hợp với các hệ thống lớn, nơi dữ liệu được tổ chức theo nhiều cách khác nhau và cần một cách tiếp cận linh hoạt để truy vấn. Ví dụ: một hệ thống có thể có một index cho tài liệu pháp lý, một index cho tài liệu y tế và một index cho tài liệu kỹ thuật. ComposableGraphIndex cho phép bạn kết hợp tất cả chúng lại với nhau để tạo ra một trải nghiệm tìm kiếm đồng nhất.
3.6.6.4.3. Storing#
1. Một số thuật ngữ:
Storage: Là nơi lưu trữ Index và Metadata liên quan. Có thể là một cơ sở dữ liệu, một hệ thống tệp hoặc một dịch vụ lưu trữ đám mây.
Metadata: Là thông tin bổ sung về dữ liệu, chẳng hạn như tác giả, ngày tạo, hoặc các thuộc tính khác. Metadata có thể được sử dụng để tổ chức và tìm kiếm dữ liệu trong Index.
Storage Context: Là một đối tượng như 1 manager chứa thông tin về cách lưu trữ DocumentStore, IndexStore, VectorStore, các cấu hình kết nối, và các thông tin khác cần thiết để truy cập và quản lý dữ liệu trong Index.
Document stores: where ingested documents (i.e., Node objects) are stored
Index stores: where index metadata are stored
Vector stores: Lưu trữ các vector embeddings được tạo ra từ các Node (các phần nhỏ của Document). Đây là thành phần quan trọng cho việc tìm kiếm dựa trên sự tương đồng ngữ nghĩa (semantic similarity search).
Property Graph stores: where knowledge graphs are stored (i.e. for
PropertyGraphIndex
)Chat Stores: where chat messages are stored and organized.
2. Sử dụng persist()
của đối tượng StorageContext
Mặc định, LlamaIndex sẽ lưu trữ các index và metadata trong In-memory. Tuy nhiên, bạn có thể muốn lưu trữ chúng vào một nơi khác (như local folder, cơ sở dữ liệu hoặc dịch vụ đám mây) để dễ dàng truy cập và quản lý hơn. Khi bạn gọi persist()
trên đối tượng StorageContext
, nó sẽ lưu trữ tất cả các index và metadata vào nơi mà bạn đã cấu hình trước đó. Điều này giúp bạn có thể dễ dàng truy cập lại chúng sau này mà không cần phải tải lại từ đầu.
Persisting to disk
index.storage_context.persist(persist_dir="<persist_dir>") # or for graph index graph.root_index.storage_context.persist(persist_dir="<persist_dir>")
Loading from disk
from llama_index.core import StorageContext, load_index_from_storage # rebuild storage context storage_context = StorageContext.from_defaults(persist_dir="<persist_dir>") # load index index = load_index_from_storage(storage_context)
Đối với External Storage (như Qdrant, Elasticsearch, v.v.), việc chạy persist()
chỉ lưu trữ các index và metadata mà không bao gồm các vector embeddings. persist()
chủ yếu sẽ lưu trạng thái của các store khác (ví dụ: IndexStore mặc định nếu bạn đang dùng) và có thể lưu một số metadata hoặc thông tin cấu hình liên quan đến Vector Store ngoài vào persist_dir
, để khi tải lại (load_index_from_storage
), LlamaIndex biết cách kết nối và sử dụng lại Vector Store đó.
3.6.6.4.3.1. Vector Store#
Vector Store là nơi lưu trữ các vector embeddings được tạo ra từ các Node (các phần nhỏ của Document). Đây là thành phần quan trọng cho việc tìm kiếm dựa trên sự tương đồng ngữ nghĩa (semantic similarity search). LlamaIndex hỗ trợ nhiều loại Vector Store khác nhau Danh sách các Vector Store mà LlamaIndex hỗ trợ
Ví dụ: Workflow với Qdrant Vector Store
Thiết lập ban đầu: Kết nối Qdrant, cấu hình LlamaIndex.
%pip install -qU llama-index qdrant-client llama-index-vector-stores-qdrant
Note: you may need to restart the kernel to use updated packages.
import os
from dotenv import load_dotenv
import qdrant_client
from llama_index.core import (
VectorStoreIndex,
SimpleDirectoryReader,
StorageContext,
load_index_from_storage,
Document,
Settings,
)
from llama_index.vector_stores.qdrant import QdrantVectorStore
from qdrant_client.http.models import Distance, VectorParams
from llama_index.embeddings.openai import OpenAIEmbedding
# --- 1. Thiết lập cấu hình ---
load_dotenv(".env")
QDRANT_PATH = "./data/qdrant_data" # Thư mục lưu dữ liệu Qdrant local
COLLECTION_NAME = "my_end_to_end_collection" # Tên collection trong Qdrant
PERSIST_DIR = "./data/llama_index_metadata" # Thư mục lưu metadata của LlamaIndex
# (Tùy chọn nhưng nên làm) Cấu hình mô hình embedding toàn cục
Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")
# Settings.llm = None # Có thể cấu hình LLM nếu cần, ví dụ dùng Ollama, OpenAI...
# Tạo các thư mục nếu chưa tồn tại
if not os.path.exists(PERSIST_DIR):
os.makedirs(PERSIST_DIR)
# Thư mục QDRANT_PATH sẽ được Qdrant client tự tạo nếu dùng path local
print("--- GIAI ĐOẠN 1: THIẾT LẬP CẤU HÌNH BAN ĐẦU ---")
# Kết nối Qdrant Client
# Sử dụng client lưu trữ local (file-based persistence)
# Nếu dùng Qdrant server, thay đổi thành:
# client = qdrant_client.QdrantClient(host="localhost", port=6333)
# Hoặc: client = qdrant_client.QdrantClient(url="<your-qdrant-url>", api_key="<your-api-key>")
client = qdrant_client.QdrantClient(path=QDRANT_PATH)
print(f"Đã kết nối Qdrant client (Lưu trữ tại: {QDRANT_PATH})")
--- GIAI ĐOẠN 1: THIẾT LẬP CẤU HÌNH BAN ĐẦU ---
Đã kết nối Qdrant client (Lưu trữ tại: ./data/qdrant_data)
Tạo Index lần đầu: Nạp một số tài liệu ban đầu và xây dựng index, lưu vector vào Qdrant và metadata vào thư mục local.
# --- 2. Tạo Index Lần Đầu ---
print("\n--- GIAI ĐOẠN 2: TẠO INDEX LẦN ĐẦU ---")
# Kiểm tra xem index đã tồn tại trong thư mục persist chưa
# Nếu chưa tồn tại, chúng ta sẽ xây dựng nó
if not os.path.exists(
os.path.join(PERSIST_DIR, "docstore.json")
): # Kiểm tra 1 file đặc trưng
print(f"Không tìm thấy index trong '{PERSIST_DIR}'. Bắt đầu xây dựng index mới...")
# a. Chuẩn bị tài liệu ban đầu
# Ví dụ: Tạo các đối tượng Document thủ công
initial_documents = [
Document(text="Hà Nội là thủ đô sôi động của Việt Nam, nổi tiếng với Phố Cổ."),
Document(text="Qdrant là một cơ sở dữ liệu vector hiệu năng cao."),
Document(
text="LlamaIndex giúp xây dựng ứng dụng RAG (Retrieval-Augmented Generation)."
),
]
# Hoặc đọc từ thư mục (ví dụ: tạo thư mục 'initial_data' và đặt file text vào đó)
# os.makedirs("initial_data", exist_ok=True)
# with open("initial_data/doc1.txt", "w") as f: f.write("...")
# initial_documents = SimpleDirectoryReader("./initial_data").load_data()
print(f"Đã chuẩn bị {len(initial_documents)} tài liệu ban đầu.")
# b. Tạo đối tượng QdrantVectorStore
# Lần đầu tạo, Qdrant client sẽ tạo collection nếu chưa có
vector_store = QdrantVectorStore(
client=client,
collection_name=COLLECTION_NAME,
# Có thể cần chỉ định embedding dimension nếu không dùng Settings.embed_model
# vector_size=client.get_collection(COLLECTION_NAME).vectors_config.params.size # Lấy tự động nếu collection đã tồn tại
# Hoặc chỉ định nếu tạo mới, ví dụ: 384 cho bge-small-en-v1.5
# Hoặc để LlamaIndex tự xử lý dựa trên Settings.embed_model
)
print(f"Đã khởi tạo QdrantVectorStore cho collection '{COLLECTION_NAME}'.")
# c. Tạo StorageContext trỏ tới Qdrant Vector Store
storage_context = StorageContext.from_defaults(vector_store=vector_store)
print("Đã tạo StorageContext sử dụng Qdrant.")
# d. Xây dựng VectorStoreIndex
# Quá trình này sẽ:
# - Nhúng (embed) các tài liệu.
# - Lưu các vector vào Qdrant collection.
# - Lưu metadata và cấu trúc index vào các store mặc định (Simple*) trong StorageContext.
index = VectorStoreIndex.from_documents(
initial_documents,
storage_context=storage_context,
show_progress=True, # Hiển thị tiến trình
)
print("Đã xây dựng index ban đầu thành công. Vector đã được lưu vào Qdrant.")
# e. Lưu trữ metadata của LlamaIndex (quan trọng để tải lại)
# Lưu ý: Dữ liệu vector đã nằm trong Qdrant và được Qdrant quản lý persistence.
# Bước này lưu trạng thái của các store khác trong context (như SimpleIndexStore, SimpleDocumentStore)
# và thông tin cần thiết để LlamaIndex biết cách tái sử dụng Qdrant collection khi tải lại.
storage_context.persist(persist_dir=PERSIST_DIR)
print(f"Đã lưu metadata của LlamaIndex vào thư mục: {PERSIST_DIR}")
else:
print(
f"Đã tìm thấy index đã tồn tại trong '{PERSIST_DIR}'. Bỏ qua bước xây dựng ban đầu."
)
--- GIAI ĐOẠN 2: TẠO INDEX LẦN ĐẦU ---
Đã tìm thấy index đã tồn tại trong './data/llama_index_metadata'. Bỏ qua bước xây dựng ban đầu.
client.close() # Đóng kết nối Qdrant client
Tải lại Index: Mô phỏng việc khởi động lại ứng dụng và tải lại index từ Qdrant và metadata đã lưu.
# --- 3. Tải lại Index từ bộ nhớ ---
print("\n--- GIAI ĐOẠN 3: TẢI LẠI INDEX ---")
# a. (Quan trọng) Kết nối lại Qdrant client và tạo lại VectorStore object
# Phải trỏ đến CÙNG MỘT collection và CÙNG MỘT Qdrant instance (cùng path hoặc URL)
# Client này có thể là một instance mới, miễn là nó kết nối đúng chỗ.
client_load = qdrant_client.QdrantClient(path=QDRANT_PATH)
vector_store_load = QdrantVectorStore(
client=client_load, collection_name=COLLECTION_NAME
)
print(
f"Đã kết nối lại Qdrant và tạo lại VectorStore cho collection '{COLLECTION_NAME}'."
)
# b. Tạo lại StorageContext, chỉ định VectorStore đã kết nối VÀ thư mục persist
# LlamaIndex sẽ tải metadata từ persist_dir và sử dụng vector_store đã cung cấp.
storage_context_load = StorageContext.from_defaults(
vector_store=vector_store_load, persist_dir=PERSIST_DIR
)
print("Đã tạo StorageContext để tải, sử dụng Qdrant hiện có và metadata đã lưu.")
# c. Tải Index bằng StorageContext đã chuẩn bị
try:
loaded_index = load_index_from_storage(storage_context_load)
print("Đã tải index thành công từ Qdrant và metadata!")
# d. (Tùy chọn) Kiểm tra nhanh bằng truy vấn
query_engine_loaded = loaded_index.as_query_engine()
response_initial = query_engine_loaded.query("Qdrant là gì?")
print("\nTruy vấn thử nghiệm trên index vừa tải:")
print("Câu hỏi: Qdrant là gì?")
print("Trả lời:", response_initial)
except Exception as e:
print(f"Lỗi khi tải index: {e}")
print("Có thể bạn chưa chạy phần tạo index ban đầu, hoặc thư mục persist bị lỗi.")
exit() # Thoát nếu không tải được index
--- GIAI ĐOẠN 3: TẢI LẠI INDEX ---
Đã kết nối lại Qdrant và tạo lại VectorStore cho collection 'my_end_to_end_collection'.
Đã tạo StorageContext để tải, sử dụng Qdrant hiện có và metadata đã lưu.
Đã tải index thành công từ Qdrant và metadata!
Truy vấn thử nghiệm trên index vừa tải:
Câu hỏi: Qdrant là gì?
Trả lời: Qdrant is a high-performance vector database.
Bổ sung tài liệu mới: Thêm tài liệu mới vào index đã tải.
# --- 4. Bổ sung tài liệu mới vào Index đã tải ---
print("\n--- GIAI ĐOẠN 3: BỔ SUNG TÀI LIỆU MỚI ---")
# a. Chuẩn bị tài liệu mới
new_documents = [
Document(text="Thành phố Hồ Chí Minh là trung tâm kinh tế lớn nhất Việt Nam."),
Document(text="Embedding là quá trình chuyển đổi văn bản thành vector số."),
]
print(f"Đã chuẩn bị {len(new_documents)} tài liệu mới để bổ sung.")
# b. Chèn tài liệu mới vào index ĐÃ TẢI
# LlamaIndex sẽ tự động nhúng tài liệu mới và lưu vector vào Qdrant
# thông qua `vector_store` đã được cấu hình trong `storage_context` của `loaded_index`.
for doc in new_documents:
loaded_index.insert(document=doc)
print(f"Đã chèn tài liệu: '{doc.text[:30]}...'")
print("Đã bổ sung tài liệu mới vào index. Vector mới đã được thêm vào Qdrant.")
# c. (Lưu ý về persist sau khi insert)
# Vì Qdrant tự quản lý persistence của vector, việc gọi persist() lần nữa sau khi insert
# thường không bắt buộc đối với bản thân dữ liệu vector mới.
# Tuy nhiên, nếu cấu trúc bên trong của IndexStore (nếu là SimpleIndexStore mặc định)
# có thay đổi đáng kể do việc insert, hoặc để đảm bảo trạng thái DocumentStore (nếu dùng)
# được cập nhật trong thư mục persist, bạn CÓ THỂ gọi lại persist.
# Thông thường, đối với việc chỉ thêm vector vào VectorStore ngoài, bước này có thể bỏ qua
# hoặc chạy để đảm bảo tính nhất quán của metadata.
# loaded_index.storage_context.persist(persist_dir=PERSIST_DIR)
# print(f"(Tùy chọn) Đã cập nhật lại metadata trong: {PERSIST_DIR}")
--- GIAI ĐOẠN 3: BỔ SUNG TÀI LIỆU MỚI ---
Đã chuẩn bị 2 tài liệu mới để bổ sung.
Đã chèn tài liệu: 'Thành phố Hồ Chí Minh là trung...'
Đã chèn tài liệu: 'Embedding là quá trình chuyển ...'
Đã bổ sung tài liệu mới vào index. Vector mới đã được thêm vào Qdrant.
Truy vấn: Thực hiện truy vấn trên index đã được cập nhật.
# --- 5. Truy vấn Index đã cập nhật ---
print("\n--- GIAI ĐOẠN 4: TRUY VẤN INDEX ĐÃ CẬP NHẬT ---")
# Tạo query engine từ index đã cập nhật
query_engine_updated = loaded_index.as_query_engine()
# Thực hiện các truy vấn
queries = [
"Kể tên một trung tâm kinh tế của Việt Nam?",
"Embedding là gì?",
"Thủ đô Việt Nam là gì?", # Câu hỏi liên quan đến dữ liệu ban đầu
]
for q in queries:
print(f"\nĐang truy vấn: {q}")
response = query_engine_updated.query(q)
print("Trả lời:", response)
print("\n--- WORKFLOW HOÀN TẤT ---")
--- GIAI ĐOẠN 4: TRUY VẤN INDEX ĐÃ CẬP NHẬT ---
Đang truy vấn: Kể tên một trung tâm kinh tế của Việt Nam?
Trả lời: Thành phố Hồ Chí Minh
Đang truy vấn: Embedding là gì?
Trả lời: Embedding is the process of converting text into numerical vectors.
Đang truy vấn: Thủ đô Việt Nam là gì?
Trả lời: Thủ đô Việt Nam là Hà Nội.
--- WORKFLOW HOÀN TẤT ---
3.6.6.4.3.2. Document Store#
Mục đích sử dụng: Lưu trữ nội dung gốc (văn bản đầy đủ) và metadata của các đối tượng
Document
và/hoặcNode
(các đoạn văn bản nhỏ được chia ra từDocument
). Nó giống như một thư viện chứa toàn bộ văn bản thô bạn đã nạp vào.Tại sao cần nó (thay vì chỉ
VectorStore
)?Tách biệt dữ liệu:
VectorStore
chủ yếu tập trung lưu trữ và tìm kiếm vector embeddings hiệu quả. Nó thường chỉ lưu một tham chiếu (ID) tới Node gốc và có thể một phần nhỏ metadata/văn bản.DocumentStore
cho phép lưu trữ toàn bộ văn bản gốc (có thể rất lớn) một cách riêng biệt.Truy xuất ngữ cảnh đầy đủ: Sau khi
VectorStore
trả về các Node ID liên quan nhất dựa trên vector, bạn thường cần lấy lại toàn bộ nội dung văn bản của các Node đó (hoặc thậm chí cảDocument
cha của chúng) để LLM có đủ ngữ cảnh tổng hợp câu trả lời chính xác.DocumentStore
phục vụ mục đích này.Hiệu quả bộ nhớ/lưu trữ: Thay vì nhồi nhét toàn bộ văn bản vào
VectorStore
(vốn không được tối ưu cho việc lưu trữ text lớn) hoặc giữ tất cả trong bộ nhớ,DocumentStore
cung cấp một nơi chuyên biệt để quản lý và truy xuất khi cần.Tránh trùng lặp: Nếu cùng một tài liệu được sử dụng trong nhiều cấu trúc index khác nhau,
DocumentStore
giúp lưu trữ nó một lần duy nhất.
Ví dụ phổ biến nhất:
SimpleDocumentStore
: Đây là triển khai mặc định. Nó lưu trữ dữ liệu trong bộ nhớ (RAM). Khi bạn gọistorage_context.persist()
, nó sẽ lưu dữ liệu này xuống thành một file JSON (ví dụ:docstore.json
). Đây là lựa chọn phổ biến nhất cho các ứng dụng đơn giản hoặc khi kết hợp với các Vector Store khác.(Ít phổ biến hơn dưới dạng component riêng lẻ): Các triển khai khác có thể dùng file system hoặc các CSDL NoSQL như MongoDB (
MongoDocumentStore
), nhưng thường người ta sẽ dùng luôn CSDL đó làm Vector Store nếu nó hỗ trợ cả lưu trữ văn bản/metadata tốt.
Check Guide to Document Store và Document Store API để biết thêm chi tiết về cách sử dụng và các loại Document Store khác nhau mà LlamaIndex hỗ trợ.
from llama_index.storage.docstore.mongodb import MongoDocumentStore
from llama_index.core.node_parser import SentenceSplitter
# create parser and parse document into nodes
parser = SentenceSplitter()
nodes = parser.get_nodes_from_documents(documents)
# create (or load) docstore and add nodes
docstore = MongoDocumentStore.from_uri(uri="<mongodb+srv://...>")
docstore.add_documents(nodes)
# create storage context
storage_context = StorageContext.from_defaults(docstore=docstore)
# build index
index = VectorStoreIndex(nodes, storage_context=storage_context)
# Then, `MongoDocumentStore` connects to a fixed MongoDB database and initializes new collections (or loads existing collections) for your nodes/documents, and it's not necessery to call storage_context.persist().
3.6.6.4.3.3. Index Store#
Mục đích sử dụng: Lưu trữ cấu trúc và siêu dữ liệu (metadata) của chính bản thân Index. Nó mô tả cách các
Node
được tổ chức và liên kết với nhau bên trong một index cụ thể.Tại sao cần nó (thay vì chỉ
VectorStore
)?Lưu cấu trúc Index: Các loại index khác nhau có cấu trúc riêng biệt.
ListIndex
: Cần lưu thứ tự tuần tự của các Node.TreeIndex
: Cần lưu mối quan hệ cha-con giữa các Node.KeywordTableIndex
: Cần lưu bảng map từ khóa tới các Node ID chứa từ khóa đó.VectorStore
không được thiết kế để lưu các loại cấu trúc phức tạp này; nó chủ yếu là một “kho phẳng” các vector.IndexStore
lưu trữ thông tin cấu trúc này.
Tái tạo Index: Khi bạn tải index từ bộ nhớ đã lưu (
load_index_from_storage
), LlamaIndex cần thông tin từIndexStore
để biết cách xây dựng lại đối tượng index đúng cấu trúc (ví dụ: dựng lại cây, sắp xếp lại danh sách) trong bộ nhớ.Truy vấn không dựa trên Vector: Đối với các index không hoàn toàn dựa vào tìm kiếm vector (như
KeywordTableIndex
),IndexStore
được truy vấn trực tiếp để lấy các Node liên quan dựa trên logic của cấu trúc index đó (ví dụ: tìm Node theo từ khóa).
Ví dụ phổ biến nhất:
SimpleIndexStore
: Là triển khai mặc định, tương tựSimpleDocumentStore
. Nó lưu cấu trúc index trong bộ nhớ và persist thành file JSON (ví dụ:index_store.json
). Đây là lựa chọn cực kỳ phổ biến, ngay cả khi bạn đang sử dụngVectorStore
bên ngoài như Qdrant hay ChromaDB,SimpleIndexStore
vẫn thường được dùng để lưu phần cấu trúc logic của LlamaIndex.
from llama_index.storage.index_store.mongodb import MongoIndexStore
from llama_index.core import VectorStoreIndex
# create (or load) index store
index_store = MongoIndexStore.from_uri(uri="<mongodb+srv://...>")
# create storage context
storage_context = StorageContext.from_defaults(index_store=index_store)
# build index
index = VectorStoreIndex(nodes, storage_context=storage_context)
# or alternatively, load index
from llama_index.core import load_index_from_storage
index = load_index_from_storage(storage_context)
3.6.6.4.3.4. Chat Store#
Mục đích sử dụng: Lưu trữ lịch sử cuộc trò chuyện (message history) giữa người dùng và một Chat Engine hoặc Agent được xây dựng bằng LlamaIndex.
Tại sao cần nó (thay vì các store khác)?
Duy trì ngữ cảnh hội thoại: Các ứng dụng chatbot cần “trí nhớ” để hiểu các câu hỏi nối tiếp, tham chiếu đến thông tin đã trao đổi trước đó và giữ cho cuộc trò chuyện mạch lạc.
ChatStore
lưu trữ các lượt tin nhắn (user, assistant) theo thứ tự.Quản lý trạng thái: Giúp quản lý trạng thái của một phiên trò chuyện đang diễn ra.
Khác biệt với Knowledge Base:
DocumentStore
,IndexStore
,VectorStore
quản lý cơ sở tri thức (dữ liệu tĩnh hoặc ít thay đổi mà RAG dùng để trả lời). Ngược lại,ChatStore
quản lý lịch sử tương tác động của một phiên hội thoại cụ thể. Đây là hai loại dữ liệu hoàn toàn khác nhau.
Ví dụ phổ biến nhất:
SimpleChatStore
: Triển khai mặc định, lưu lịch sử chat trong bộ nhớ và có thể persist ra file JSON. Rất phù hợp cho các ví dụ đơn giản hoặc thử nghiệm.RedisChatStore
: Sử dụng Redis (một key-value store trong bộ nhớ, rất nhanh) để lưu trữ lịch sử chat. Đây là lựa chọn phổ biến cho các ứng dụng cần duy trì lịch sử chat giữa các phiên làm việc của người dùng hoặc cần khả năng mở rộng tốt hơn so với lưu vào file JSON đơn giản.
from llama_index.storage.chat_store.redis import RedisChatStore
from llama_index.core.memory import ChatMemoryBuffer
chat_store = RedisChatStore(redis_url="redis://localhost:6379", ttl=300)
chat_memory = ChatMemoryBuffer.from_defaults(
token_limit=3000,
chat_store=chat_store,
chat_store_key="user1",
)
3.6.6.4.3.5. Graph Store#
Mục đích sử dụng: Lưu trữ các đồ thị tri thức (knowledge graphs) được xây dựng từ các
Node
trong LlamaIndex. Đồ thị tri thức này có thể chứa các thực thể (entities) và mối quan hệ (relationships) giữa chúng.Tại sao cần nó (thay vì các store khác)?
Lưu trữ cấu trúc đồ thị: Đồ thị tri thức có cấu trúc phức tạp với các đỉnh (nodes) và cạnh (edges).
GraphStore
được thiết kế để lưu trữ và quản lý cấu trúc này một cách hiệu quả.Truy vấn đồ thị: Các truy vấn phức tạp liên quan đến mối quan hệ giữa các thực thể có thể được thực hiện dễ dàng hơn khi sử dụng
GraphStore
.Khác biệt với DocumentStore/IndexStore: Trong khi
DocumentStore
vàIndexStore
chủ yếu tập trung vào văn bản và cấu trúc index,GraphStore
tập trung vào việc lưu trữ và truy vấn các mối quan hệ giữa các thực thể trong dữ liệu.
Ví dụ phổ biến nhất:
SimpleGraphStore
: Triển khai mặc định, lưu trữ đồ thị tri thức trong bộ nhớ và có thể persist ra file JSON. Đây là lựa chọn phổ biến cho các ví dụ đơn giản hoặc thử nghiệm.Neo4jGraphStore
: Sử dụng Neo4j (một cơ sở dữ liệu đồ thị phổ biến) để lưu trữ đồ thị tri thức. Đây là lựa chọn phổ biến cho các ứng dụng cần khả năng truy vấn đồ thị phức tạp và mở rộng tốt hơn so với lưu vào file JSON đơn giản.
Lưu trữ đồ thị tri thức: Đồ thị tri thức có cấu trúc phức tạp với các đỉnh (nodes) và cạnh (edges).
GraphStore
được thiết kế để lưu trữ và quản lý cấu trúc này một cách hiệu quả.
3.6.6.4.4. Querying#
1. Một số thuật ngữ:
Retrievers: là cách thức giúp tìm kiếm và truy xuất thông tin từ Index dựa trên các truy vấn của người dùng. Retrievers có thể sử dụng các phương pháp khác nhau để tìm kiếm thông tin, chẳng hạn như tìm kiếm theo từ khóa, tìm kiếm theo ngữ nghĩa hoặc tìm kiếm theo vector.
Routers: Xác định Retriever nào (1 hoặc nhiều) sẽ được sử dụng để xử lý truy vấn của người dùng. Điều này có thể bao gồm việc xác định các điều kiện hoặc tiêu chí, dựa vào query và metadata để chọn Retriever phù hợp nhất cho truy vấn cụ thể.
Query Engines: là các thành phần giúp xử lý truy vấn của người dùng và trả về kết quả từ Index. Query Engines có thể sử dụng các phương pháp khác nhau để xử lý truy vấn, chẳng hạn như tìm kiếm theo từ khóa, tìm kiếm theo ngữ nghĩa hoặc tìm kiếm theo vector.
Node Postprocessors: Xử lý các nodes sau khi chúng đã được truy xuất từ Index. Điều này có thể bao gồm việc transform, filter, re-ranking logic các nodes trước khi trả về cho người dùng.
Response Synthesizers: Tạo ra phản hồi cuối cùng từ câu prompt được tạo bới các nodes đã truy xuất cùng với user query.
3.6.6.4.4.1. Reponse Mode#
Các response modes có thể được sử dụng trong Response Synthesis bao gồm:
refine
&compact
: đều có tinh chỉnh (refine) tuần tự, khác ở số lần gọi LLM (compact ít hơn).tree_summarize
: đệ quy tóm tắt cho đến khi có một kết quả cuối.simple_summarize
: chỉ tóm tắt một lần, nhanh nhưng dễ mất chi tiết.no_text
: chỉ lấy về dữ liệu, không gọi LLM.accumulate
&compact_accumulate
: chạy truy vấn trên từng chunk (hoặc nhóm chunk), trả về một mảng kết quả.
Chi tiết
1. refine
:
Gọi LLM nhiều lần, tuần tự qua từng “chunk” (đoạn trích) từ dữ liệu. “Chunk” đầu tiên được gửi kèm câu hỏi qua text_qa_template
để tạo câu trả lời ban đầu. Các chunk tiếp theo sẽ được sử dụng cùng với câu trả lời cũ (và câu hỏi gốc) để “refine” (tinh chỉnh) câu trả lời qua refine_template
.
Cần nhiều lời gọi LLM → kết quả chi tiết, chính xác hơn.
Nếu chunk quá dài, tự động chia nhỏ (split) để vừa khung chứa (context window).
Phù hợp cho câu trả lời cần độ chính xác, giải thích cặn kẽ.
2. compact
(default):
Kết hợp (concatenate) càng nhiều chunk càng tốt để vừa khung chứa (context window). Nếu nội dung vẫn quá dài, chia nhỏ và tiếp tục quá trình tương tự. Với mỗi phần (các chunk đã gộp) sẽ gọi LLM để tinh chỉnh giống như refine
.
Giảm số lần gọi LLM so với
refine
(vì “gom” nhiều chunk vào một lời gọi).Vẫn đảm bảo logic “tinh chỉnh” tuần tự.
Tránh tốn quá nhiều token/chi phí do gọi LLM liên tục.
3. tree_summarize
Gộp tất cả chunk lại, nếu quá dài thì chia nhỏ (có thể có chồng lấn text). Dùng summary_template
để tóm tắt từng phần, tạo ra các bản tóm tắt. Tiếp tục đệ quy (dùng chính các tóm tắt vừa tạo như “chunk” mới) đến khi chỉ còn một tóm tắt cuối cùng.
“Xây cây” tóm tắt dần dần, đệ quy.
Không có bước refine, chỉ tóm tắt (summary) trực tiếp.
Lý tưởng cho việc tóm tắt tài liệu lớn, tuần tự rút gọn nhiều tầng.
4. simple_summarize
Gộp toàn bộ các chunk vào một prompt duy nhất (nếu quá dài sẽ bị cắt/trunc). Gọi LLM một lần để tóm tắt.
Nhanh, đơn giản, nhưng dễ mất chi tiết nếu dữ liệu nhiều.
5. no_text
Chỉ lấy các chunk bằng retriever, không gửi chúng vào LLM. Thường để kiểm tra hay debug dữ liệu được truy xuất.
6. accumulate
Áp câu hỏi lên từng chunk (mỗi chunk gọi LLM riêng), trả về một list kết quả. Sau đó ghép (concatenate) tất cả kết quả lại thành một chuỗi.
Mỗi chunk được xử lý tách biệt.
7. compact_accumulate
Tương tự accumulate
nhưng sẽ “gom” (compact) các chunk nếu cần để vừa khung chứa. Vẫn chạy câu hỏi riêng với từng nhóm chunk đã gộp.
Giảm thiểu số lần gọi LLM nếu có nhiều chunk nhỏ.
3.6.6.4.4.2. Engines#
Query Engines: Là các thành phần giúp xử lý truy vấn của người dùng và trả về kết quả từ Index. Query Engines có thể sử dụng các phương pháp khác nhau để xử lý truy vấn, chẳng hạn như tìm kiếm theo từ khóa, tìm kiếm theo ngữ nghĩa hoặc tìm kiếm theo vector.
Chat Engines: Là các thành phần giúp xử lý các cuộc trò chuyện (chat) giữa người dùng và hệ thống. Chat Engines có thể sử dụng các phương pháp khác nhau để xử lý các cuộc trò chuyện, chẳng hạn như tìm kiếm theo từ khóa, tìm kiếm theo ngữ nghĩa hoặc tìm kiếm theo vector.
3.6.6.4.4.2.1. Query Engine#
3.6.6.4.4.2.2. Chat Engine#
3.6.6.4.4.3. Node Postprocessors#
Miêu tả: Là các thành phần xử lý các Nodes sau khi chúng đã được truy xuất từ Index. Điều này có thể bao gồm việc transform, filter, hoặc re-rank các Nodes trước khi trả về cho người dùng, đảm bảo rằng các Nodes được chọn là những gì tốt nhất cho câu hỏi cụ thể.
Vai trò: Giúp tinh chỉnh và tối ưu hóa kết quả truy vấn, đảm bảo rằng người dùng nhận được thông tin chính xác và có liên quan nhất. Các postprocessors có thể bao gồm việc loại bỏ các Nodes không cần thiết, sắp xếp lại thứ tự của các Nodes dựa trên độ liên quan, hoặc thậm chí là thực hiện các phép toán phức tạp hơn trên dữ liệu.