Gå til innhold

Diskusjonen vi ikke har om AI


Anbefalte innlegg

Videoannonse
Annonse
Skrevet

Jeg har enda ikke funnet en LLM som klarer å telle ned fra 10 til 0 med 3 sekunders mellomrom mellom hvert tall

Skrevet
1 minute ago, vortex said:

Jeg har enda ikke funnet en LLM som klarer å telle ned fra 10 til 0 med 3 sekunders mellomrom mellom hvert tall

Du kan få den til å lage et script som teller ned fra 10 til 0 med 3 sekunders mellomrom. Du kan si det er en begrensning men det er ikke en teknisk begrensning, det er fordi ingen har synes det har vært viktig nok å implementere.

Skrevet
1 minute ago, vortex said:

Jeg har enda ikke funnet en LLM som klarer å telle ned fra 10 til 0 med 3 sekunders mellomrom mellom hvert tall

Når man bruker et LLM. så må man tenke som en LLM og la LLM'et gjøre det som den er god til. Å utarbeide et program ved hjelp av et LLM, som gjør akkurat det, skulle nok gå ganske bra.

Skrevet
vortex skrev (1 minutt siden):

Jeg har enda ikke funnet en LLM som klarer å telle ned fra 10 til 0 med 3 sekunders mellomrom mellom hvert tall

Det ville jeg ikke forventet at en LLM skal klare. 

 

Skrevet (endret)
Philber Desanex skrev (11 timer siden):

Jeg lurer også på spørsmålet var formulert for å få det absurde svarer.

Helt hypotetisk kunne man jo spurt :"Legg ut om bokbål som 17. mai tradisjon" og provosert frem tullesvar hvis målet var å få frem at AI er ubrukelig.

Jeg vil ikke anklage@Fibonacci for noe sånt,  så da må jeg nesten anta at Mistral er problemet.

Ett ord: "bokbål"

Prøvde igjen nå:

(Der står bokbål tradisjon øverst, men tradisjon er noe Le Chat la til selv)

Screenshot_20260312-005710.png

Endret av Fibonacci
Skrevet (endret)
2 hours ago, Fibonacci said:

Ett ord: "bokbål"

Prøvde igjen nå:

Men dette er jo et eksempel på hvordan man ikke kan bruke noe AI system av type LLM. Forutsetningen vil jo være jo at man etablerer kontekst og avgrensninger, som gjør at det kan komme "et fornuftig svar" ut i fra systemet. Hva som er "et fornuftig svar", det vil jo da også avhenge av hva man selv definerer som et fornuftig svar.

Det er jo det som er forskjellen på "kunstig intelligens" og "ekte intelligens". Kunstig intelligens, er bare en form for "avanserte, automatiserte oppslag i datastrukturer", eller "simulerte nevrale nettverk", om man vil. For at det som kunner ut av systemer for kunstig intelligens skal ha noe med fornuft å gjøre, så må kunstig intelligens styres av ekte intelligens. 

Endret av arne22
Skrevet (endret)

Jeg synes faktisk at "Le Chat" gir ganske gode svar:

Spørsmål:

Quote

Kan du gi meg en kort beskrivelse av hvordan spørsmål bør formuleres i forhold til Chat Mistral, for at man skal oppnå meningsfulle og brukbare svar?

Svar i fra "Le Chat":

Quote

Her er en kort og praktisk guide til hvordan du kan formulere spørsmål for å få best mulig svar fra meg (Chat Mistral):

1. Vær presis og konkret

  • Eksempel: I stedet for «Fortell meg om klima», spør «Hva er de viktigste årsakene til global oppvarming i 2026?»
  • Hvorfor: Jo mer spesifikt spørsmålet er, jo mer relevant blir svaret.

2. Angi kontekst eller bakgrunn

  • Eksempel: «Jeg er student og trenger en enkel forklaring på fotosyntese for en presentasjon.» i stedet for bare «Hva er fotosyntese?»
  • Hvorfor: Kontekst hjelper meg å tilpasse svaret til dine behov.

3. Del opp komplekse spørsmål

  • Eksempel: I stedet for «Hvordan fungerer kunstig intelligens og hva er fremtiden for AI?», spør først «Hva er grunnleggende prinsipper for kunstig intelligens?» og deretter «Hvilke trender innen AI forventes de neste 5 årene?»
  • Hvorfor: Enkle spørsmål gir klarere og mer utfyllende svar.

4. Bruk naturlig språk

  • Eksempel: «Kan du hjelpe meg å forstå hvordan jeg kan forbedre søvnkvaliteten min?» i stedet for «Søvnkvalitet forbedring metoder.»
  • Hvorfor: Naturlig språk gjør det lettere for meg å forstå intensjonen din.

5. Spør om kilder eller oppdaterte data

  • Eksempel: «Hva er de siste forskningsresultatene om koronavaksiner per mars 2026?»
  • Hvorfor: Jeg kan søke etter oppdatert informasjon hvis du ber om det.

6. Vær tydelig på hva du ønsker som resultat

  • Eksempel: «Jeg trenger en liste over de fem beste bøkene om ledelse for nybegynnere.» i stedet for «Hvilke bøker om ledelse finnes?»
  • Hvorfor: Klare forventninger gir mer nyttige svar.

 

Mener at dette også er de samme hovedprinsippene som jeg selv bruker når jeg jobber opp mot ChatGPT, så har kan det jo se ut som at systemene fungerer forholdvis likt.

Endret av arne22
Skrevet

Jeg synes Mistral klarer seg bra. Jeg fikk dette svaret når jeg skrev inn Bokbål på Mistral:

 

 

Ordet «bokbål» refererer til en handling der bøker blir brent, ofte som en form for sensur, protest eller symbolsk handling. Historisk sett er bokbål kjent fra perioder med politisk eller religiøs undertrykkelse, der bøker som ble ansett som farlige eller uønskede ble ødelagt offentlig. Eksempler inkluderer bokbål under nasjonalsosialismen i Tyskland på 1930-tallet, der bøker av jødiske, kommunistiske og andre «uønskede» forfattere ble brent.

I dag brukes begrepet også metaforisk for å beskrive forsøk på å undertrykke eller fjerne litteratur eller ideer.

Hva tenkte du på når du spurte om bokbål? Er det noe spesifikt du lurer på, for eksempel historiske hendelser, symbolikk eller dagens debatt om sensur?

 
 
Skrevet
47 minutes ago, Camlon said:

Jeg testet Mistral. Logikk er ihvertfall ikke den sterkeste side

https://chat.mistral.ai/chat/9d2040bb-05c2-4d29-be3a-d4d716ec01f2

Et AI som dette fungerer jo på mange måter som et verktøy som "forlenger" og "forbedrer" egenskapene til den personen som bruker verktøyet. Hvorvidt man bruker en elektrisk drill, en elektrisk hammer, eller vinkelsliper, eller en skrutrekker, det kommer jo an på arbeidsoppgavens egenart, hvilken jobb som skal gjøres, og hvor dyktig man selv er både både til å bruke verktøyet og til å løse oppgaven. 

En elektrisk drill fungerer ikke nødvendigvis godt som en hammer, men det betyr jo ikke nødvendigvis at det er en dårlig drill.

  • Innsiktsfullt 1
Skrevet
1 hour ago, arne22 said:

Et AI som dette fungerer jo på mange måter som et verktøy som "forlenger" og "forbedrer" egenskapene til den personen som bruker verktøyet. Hvorvidt man bruker en elektrisk drill, en elektrisk hammer, eller vinkelsliper, eller en skrutrekker, det kommer jo an på arbeidsoppgavens egenart, hvilken jobb som skal gjøres, og hvor dyktig man selv er både både til å bruke verktøyet og til å løse oppgaven. 

En elektrisk drill fungerer ikke nødvendigvis godt som en hammer, men det betyr jo ikke nødvendigvis at det er en dårlig drill.

Mistral markedsfører seg selv som multiverktøy, ikke bare som en elektrisk drill. Det er derfor helt naturlig å forvente at den kan også fungere som en hammer (logikk).

Og Mistral er svak på flere områder enn logikk. Her er et nytt eksempel.

https://chat.mistral.ai/chat/bfbaa6f4-acb1-42a3-8b43-6e610f96a626

Skrevet (endret)
1 hour ago, Camlon said:

Mistral markedsfører seg selv som multiverktøy, ikke bare som en elektrisk drill. Det er derfor helt naturlig å forvente at den kan også fungere som en hammer (logikk).

Men uiansett verktøytype så er det vel fagmannen som bruker verktøyet og ikke verktøyet selv som har mest betydning for utført jobb?

Helt generelt, så vil jeg mene at det er helt feil å forvente at AI selv skal kunne få til det ene eller det annet. Det vil avhenge først og fremst av den personen som bruker verktøyet og hvordan verktøyet blir brukt. Skal bruken av AI vertøy bli vellykket, så må den som bruker verktøyet både ha en god oversikt over det fagområdet som AI verktøyet anvendes på, pluss at den som bruker verktøyet må ha en tilsvarende god innsikt i hvordan AI verktøyet fungerer, slik at man kan optimalisere og tilpasse bruken av verktøyet. 

Mistral lagde helt håpløse svar og ganske brukbare svar over i eksemplene over. Det hadde bare med bruken av systemet å gjøre, og hvordan man formulerte input.

Endret av arne22
Skrevet
7 minutes ago, arne22 said:

Men uiansett verktøytype så er det vel fagmannen som bruker verktøyet og ikke verktøyet selv som har mest betydning for utført jobb?

Helt generelt, så vil jeg mene at det er helt feil å forvente at AI selv skal kunne få til det ene eller det annet. Det vil avhenge først og fremst av den personen som bruker verktøyet og hvordan verktøyet blir brukt. Skal bruken av AI vertøy bli vellykket, så må den som bruker verktøyet både ha en god oversikt over det fagområdet som AI verktøyet anvendes på, pluss at den som bruker verktøyet må ha en tilsvarende god innsikt i hvordan AI verktøyet fungerer, slik at man kan optimalisere og tilpasse bruken av verktøyet. 

Mistral lagde helt håpløse svar og ganske brukbare svar over i eksemplene over. Det hadde bare med bruken av systemet å gjøre, og hvordan man formulerte input.

Hvordan tror du jeg vet at den er på bærtur i det andre eksemplet. Det er fordi jeg har god oversikt og forstår at løsningen er håpløs. Den feilet nettopp fordi den ikke når opp til forventningene til fagmenn.

Jeg bruker AI på jobb hver dag og det er viktig for meg at modellen har høy kvalitet. Hvis den mangler kunnskap som vi så eksempel 2 og sliter med logikk som vi så i eksempel 1, så må jeg hele tiden korrigere den og da er det mer effektivt å gjøre det selv.

Skrevet

Mistral er ikke på høyde med de beste modellene, den ligger noe bak. Et år eller 2. Det betyr at den sliter i konkurransen, men den bør absolutt satses på og forbedres, som europeisk AI.

  • Liker 1
Skrevet (endret)
1 hour ago, arne22 said:

Synes det var noe interessant info her:

https://www.leanware.co/insights/chatgpt-vs-mistral

Jeg er mer interessert i annarkjente leaderboards enn en artikkel som håndplukker en gammel GPT-modell GPT-5, ignorer alle de andre modellene som eksisterer og velger spesifikke rangeringer hvor Mistral gjør det bedre.

Model Name Score Blended Price (USD/1M Tokens)
Gemini 3.1 Pro Preview 57 $4.50
GPT-5.4 (xhigh) 57 $5.63
Claude Opus 4.6 (max) 53 $10.00
GPT-5.2 (medium) 47 $4.81
Gemini 3 Flash 46 $1.13
Claude Opus 4.6 (no reasoning) 46 $10.00
DeepSeek V3.2 42 $0.32
Grok 4 42 $6.00
GPT-5 mini (high) 41 $0.69
Gemini 3 Flash (no reasoning) 35 $1.13
GPT-5.2 (no reasoning) 34 $4.81
Mistral Magistral Medium 1.2 27 $2.75
Mistral Large 3 (no reasoning) 23 $0.75
Mistral Medium 3.1 (no reasoning) 21 $0.80
Mistral Magistral Small 1.2 18 $0.75
Mistral Small 3.2 (no reasoning) 15 $0.15

https://artificialanalysis.ai/leaderboards/models

Endret av Camlon
Skrevet (endret)
3 hours ago, Camlon said:

Jeg er mer interessert i annarkjente leaderboards enn en artikkel som håndplukker en gammel GPT-modell GPT-5, ignorer alle de andre modellene som eksisterer og velger spesifikke rangeringer hvor Mistral gjør det bedre.

Nå var nok  ikke den problemstillingen det som jeg la merke til i den artikkelen, og som gjorde at jeg syntes det var interessant å lenke den opp for senere refferanse. For meg så handlet artikkelen rent kvalitativt om noe helt annet. Men det må da være opp til hver enkelt å velge hva man velger å legge merke til i en artikkel og ikke. 

Endret av arne22

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...