Jul 8, 2024
import pandas as pd
import numpy as np
import os
import ticktoken
import openai
openai.api_key = konfigurasjon
tiktoken.get_encoding('cl100k_base')
filnavn
, innhold
, tokens
listdir(katalog_navn)
for å liste filerencoding.encode(' '.join(innhold))
df.append({'filnavn': filnavn, 'innhold': innhold, 'tokens': len(tokens)}, ignore_index=True)
Data_store
print(df)
openai.Embedding.create(model=model, input=tekst)
result['data'][0]['embedding']
{row['filnavn']: get_embedding(row['innhold']) for index, row in df.iterrows()}
get_embedding(user_query)
np.dot(query_embedding, np.array(doc_embedding))
user_query = 'How poverty is the reason for homelessness?'
{'rolle': 'system', 'innhold': 'Du er en professor som gir presise svar.'}
{'rolle': 'bruker', 'innhold': brukertekst}
respons = openai.ChatCompletion.create(model='gpt-3.5-turbo', messages=meldinger)