Assembly (ohjelmointikieli)

Wikipedia
Loikkaa: valikkoon, hakuun
Tämä artikkeli käsittelee tietokoneohjelmointia. Katso Assembly sanan muista merkityksistä.
Motorola 6800 8-bittisen mikroprosessorin assembly-kielellä kirjoitetun koodin käännöslistausta.

Assembly eli assembler on ohjelmointikieli, joka on lähellä konekieltä. Toinen nimitys assembly-kielelle on symbolinen konekieli.

Konekieli on mikroprosessorin tai vastaavan laitteen ymmärtämä kieli. Konekielen käskyt ovat lukujonoja, ja siksi vaikeita muistaa. Siksi konekielen kirjoittamisessa käyteään yleensä assemblyä. Assembly-ohjelma muutetaan konekieliseksi assembler-kääntäjällä.

Assembly-ohjelma koostuu muistikkaista, jotka vastaavat konekielen käskyjä. Yleensä muitikkaisin liitty operandeja. Lisäksi assembly-kielisessä ohjelmassa on muistiosoitteiden nimiä ja muita apusanoja.

Assemblyn käytön varjopuolia verrattuna C:n tyyppisiin korkean tason kieliin ovat muun muassa ohjelmoinnin vaikeus, hitaus ja virhealttius. Assemblyn käyttö vaatii taitoa ja tarkkuutta.

Assembly-kieli on huonosti siirrettävä kieli eri prosessoreiden välillä. Eri prosessorityypeille on erilaiset assembly-ohjelmat, elleivät prosessorit ole keskenään yhteensopivia. Assemblyä vaivaa myös assembler-kääntäjien arilaisuus esim PC-maailmassa. Eri valmistajien tekemät assembly-kääntäjät saattavat erota toisistaan huomattavasti, vaikka prosessori olisikin sama.

Assemblyn vahvin puoli sillä tuotetun ohjelman nopeus. Assembly on myös melko helppo oppia, koska sen käskyt ovat melko yksinkertaisia.

Assembleria on käytetty monesti korkean tason kielten ohella nopeuttamaan ohjelman ajoa joissain kohdissa. Korkean tason kielen kääntäjät, esimerkiksi GCC, osaavat kääntää ns. inline-assemblyä.


Assembly , symbolinen konekieli[muokkaa | muokkaa wikitekstiä]

Apple II:n konekieltä ja assembleria. Ensimmäinen sarake, muistisoitteita. Suraava sarakeryhmä, kokekieltä heksadesimaalina. Viimeiset kaksi saraketta., Assembly-kieltä. 3. sarake, käskyjen muistikakat, 4. sarake käskyjen operandit.


Assembly on ohjelmointikielten alaluokka ja tarkoittaa symbolisia konekieliä. Tietokoneiden ymmärtämät konekielet koostuvat yleensä binäärimuotoisista käskyistä, jotka voidaan esittää esimerkiksi 1- ja 0-merkkien sarjoina.

Eräs IBM:n 8086-prosessorin konekielen käsky siirtää prosessorin AL-rekisteriin luvun 97

10110000 01100001

Monesti tämä esitetään 16-järjestelmän lukuna, heksadesimaalilukuna eli "heksalukuna", käska tämä on helpompaa.

B0 61

Assembly-kielinen käsky näyttää vielä selkeämmältä

MOV AL, 61h       ; Kommentti: Siirrä AL-rekisteriin luku 97 , mikä on heksadesimaalilukuna 61 h (61 hex)

jossa "MOV" on käskyn muistikas ja 61h operandi.

Edellinen oli IBM:n syntaksia, jota käytetään esimerkiksi MASM:issa.

IBM:n syntaksissa moperandit ovat järjestykessä kohde, lähde eli "al, 61h"

Sama käsky AT&T:n syntaksilla, jota käytetään GAS:ssa

movb    $0x61,%al

Tässä syntaksissa operandit ovat tosin päin, järjestyksessä lähde, kohde.

Symbolinen konekieli on konekielen havainnollisempi ja ihmisläheisempi esitysmuoto, joka määrittelee konekielen käskyille kirjoitetun kielen kaltaisen ulkoasun. Assembly-kielessä on siten lähes sama rakenne ja komennot kuin varsinaisessa konekielessä, mutta tekstimuotoisuus helpottaa ohjelman kirjoittamista ja ymmärtämistä. Lisäksi eri muistiosoitteisiin viitataan assemblyssa usein nimin ja itse muistiosoite voidaan antaa assemblerin määriteltäväksi. Konekieli ja siis myös assembly ovat sidonnaisia tiettyyn suoritinperheeseen.

Assembly-kielinen ohjelma muutetaan konekielelle assembleriksi nimetyllä kääntäjällä. Samaa laiteympäristöä varten voi olla useita eri syntakseja noudattavia assembly-kieliä ja niille omat kääntäjänsä. Assembly-kieliä ovat muun muassa Intel x86 Assembly ja AT&T Assembly, jotka ovat molemmat x86-konekielen symbolisia esitysmuotoja. Sen sijaan esimerkiksi ARM-konekielen kirjoittamiseen käytetään ARM-assemblyä.

Assemblyn käyttökohteet[muokkaa | muokkaa wikitekstiä]

Assembly antaa ohjelmoijalle täyden määräysvallan suorittimelle syötettävän komentosarjan suhteen, ja siksi sitä käyttämällä voidaan hyödyntää tietokoneen resurssit tehokkaasti. Assemblyä käytettiin kotimikrojen alkuaikoina melko yleisesti. Esimerkiksi MS-DOS-käyttöjärjestelmä, taulukkolaskentaohjelma Lotus 1-2-3 ja lähes kaikki Commodore 64:n sekä Amigan kaupalliset videopelit ohjelmoitiin assemblyllä.

Puhtaan assembly-kielen käyttöä on perinteisesti puoltanut ohjelmakoodin tiiviys verrattuna kääntäjien tuottamaan konekieleen. Etenkin varhaisten tietokoneiden ferriittirengasmuistit, kotitietokoneiden muistit sekä sulautettujen järjestelmien ohjelmamuistit ovat olleet verrattain pieniä ja asettaneet tiukan rajan suoritettavan ohjelman koolle. Assembly-kielellä toteutettuun ohjelmaan voitiin koodata vain sovelluksen tarvitsemat toiminnot, kun taas esimerkiksi FORTRAN- tai Algol-kielellä toteutetut ohjelmat toivat aina mukanaan ylimääräistä koodia; tyypillisesti suoraan assemblyllä toteutettu ohjelma oli noin 1/10 korkean tason kielellä tuotettua ohjelmaa pienempi. Kokoedun takia esimerkiksi kiintolevyn alussa oleva käynnistyskoodi kirjoitetaan nykyäänkin assemblyllä.

Sovellusohjelmien osalta tällainen optimointi ei kuitenkaan yleensä enää ole mielekästä, eikä assemblyä juurikaan käytetä nykyaikaisten, PC:n kaltaisten koneiden eikä myöskään älypuhelinten sovellusohjelmoinnissa. Sovellusohjelmat ovat niin isoja, ettei niitä voi mielekkäästi hallita assembly-tasolla. Suorittimet ovat myös niin tehokkaita, että koodin nopeutuksella saatava hyöty ei yleensä ole vaivan arvoista. Pullonkaulat ovat yleensä muualla, kuten I/O-operaatioiden ja sivutuksen aiheuttamassa viiveessä. Korkean tason ohjelmointikielten kääntäjät ovat myös kehittyneet, ja samalla suorittimet sisäiseltä toiminnaltaan monimutkaistuneet niin, että kääntäjä tuottaa useimmiten tehokkaampaa koodia kuin mitä käsin ohjelmoimalla voisi saada aikaan, varsinkaan kohtuullisella työmäärällä. Lisäksi esimerkiksi tehokkaiden algoritmien ja tietorakenteiden valinta saattaa suurempia kokonaisuuksia assemblyllä koodattaessa jäädä pahasti taka-alalle, koska niiden toteuttaminen voi olla konekielellä liian työlästä.

Sulautettujen järjestelmien ohjelmoinnissa on assemblyllä jonkin verran vahvempi asema kuin PC-koneiden ohjelmoinnissa. Kokonaisia ohjelmia ei silti näillekään järjestelmille ole mielekästä ohjelmoida pelkällä assemblyllä.

Erityistilanteissa assemblyllä on kuitenkin vielä tärkeä asema. Sitä voi tarvita laitteistoläheistä ohjelmointia vaativissa tehtävissä, kuten laiteohjainten kehityksessä. Vielä toisinaan assemblyllä on käyttöä myös tehokkuutta vaativissa sovelluksissa, kuten salauksessa tai videon koodauksessa, kun ohjelman osia optimoidaan. Näissäkin tapauksissa assemblyllä koodataan mahdollisimman pieni osa. Kääntäjän tuottamaa assembly-koodia analysoimalla voidaan löytää keinoja korjata korkeamman tason koodia ja kääntäjälle annettavia ohjeita, kunnes tulos on haluttu. Koodin ymmärtäminen assembly-tasolla on joskus tärkeää myös vianetsinnässä.

Assembly-esimerkkejä[muokkaa | muokkaa wikitekstiä]

Tekstin tulostaminen MS-DOS -käyttöjärjestelmällä[muokkaa | muokkaa wikitekstiä]

Alla on esimerkki Assembly-kielisestä ohjelmasta Intelin x86-suvun arkkitehtuureille. Ohjelmakoodissa on käytetty Intelin x86-merkintätapaa. Ohjelma on MS-DOS-käyttöjärjestelmässä suoritettava COM-tyyppinen ohjelma.

1  org 100h
2  section .text  
3
4         mov ah,9h
5         mov dx,offset teksti
6         int 21h
7         ret
8
9 teksti: db 'Hei maailma!$'

Ohjelma kutsuu MS-DOS -käyttöjärjestelmän järjestelmäkutsua, joka tulostaa annetussa muistiosoitteessa olevan tekstin "Hei maailma!".

Rivi 1 määrittelee ohjelman alkuosoitteen segmenttinsä sisällä. Com-tyyppisissä ohjelmissa alkuosoite on aina 100h.

Rivi 2 ilmoittaa kääntäjälle, minkä tyyppistä aineistoa tässä kappaleessa on.

Rivi 4: heksaluku 9 siirretään rekisteriin AH.

Rivi 5: rekisteriin DX siirretään muistipaikan teksti osoite.

Rivi 6: Tulostamiseen käytetään PC:n DOS-käyttöjärjestelmien ohjelmistokeskeytystä 21h (h tarkoittaa heksalukua, luku on desimaalisena 33), jolle halutun toiminnon numero (9) annetaan rekisterissä AH. Rekisterissä DX on muistiosoite, josta haluttu $-merkkiin loppuva teksti alkaa datasegmentin ds sisällä.

Rivi 7: Rutiinin suorittamisen jälkeen palataan pääohjelmaan, mikä onnistuu com-tyyppisessä ohjelmassa pelkällä ret-käskyllä . Muuntyyppisessä ohjelmassa voi olla tarpeen käyttää ohjelmistokeskeytyksen 21h alaista toimintoa 4Ch.

Rivi 9: Tekstiin kuuluvat tavut on määritelty rivillä 9, joten ne alkavat heti ohjelmakoodin viimeisen tavun jälkeen. Tekstin alkuosoitteelle on annettu nimi (osoite) teksti. Lopussa oleva dollarin merkki päättää tulostuksen.

Yllä olevaa ohjelmaa vastaava korkean tason kieline, tässä PASCAL-ohjelma on

program Hello;
begin
  writeln( 'Hello World' );
end.

Fibonaccin lukujen laskeminen[muokkaa | muokkaa wikitekstiä]

Seuraava esimerkki on Fibonaccin lukujen laskija Motorola 68K-suoritinperheelle. Lasketaan n:s Fibonaccin luku antamalla n rekisterissä d0. Fibonaccin n:s luku f_n lasketaan silmukassa kaavalla: f_{n} = f_{n - 1} + f_{n - 2}, ja f_0 = 1 ja f_1 = 1.

 1  fibonacci:      cmp.l #1,d0
 2                  bgt.b overone
 3                  moveq #1,d0
 4                  rts
 5  overone:        moveq #1,d1
 6                  moveq #1,d2
 7                  moveq #1,d3
 8  loop:           move.l d2,d4
 9                  add.l  d3,d4
10                  move.l d3,d2
11                  move.l d4,d3
12                  addq.l #1,d1
13                  cmp.l  d0,d1
14                  bne.b  loop
15                  move.l d4,d0
16                  rts

Riveillä 1-4 tarkistetaan, onko d0 \leq 1, ja jos se on, lopetetaan aliohjelma ja palautetaan tuloksena 1. Rivillä 5 asetetaan silmukkalaskuri rekisterissä d1 arvoon 1. Riveillä 6 ja 7 asetetaan rekisterit d2 ja d3 arvoihin f_0 ja f_1. Rivillä 8 alkaa silmukka. Rivit 8 ja 9 laskevat seuraavan Fibonaccin luvun rekisteriin d4 summaamalla kaksi edellistä lukua rekistereistä d2 ja d3. Riveillä 10 ja 11 tallennetaan muistiin 2 uusinta Fibonaccin lukua rekistereihin d2 ja d3 seuraavaa kierrosta varten. Rivillä 12 kasvatetaan silmukkalaskuria yhdellä. Riveillä 13 ja 14 vertaillaan silmukkalaskuria ja n:ää. Mikäli n on saavutettu, lopetetaan silmukka. Muuten hypätään takaisin riville 8. Rivillä 15 siirretään tulos rekisteristä d4 rekisteriin d0, ja rivillä 16 poistutaan aliohjelmasta.

Esimerkeistä[muokkaa | muokkaa wikitekstiä]

Esimerkit antavat hyvän kuvan, miksi sovelluksia kehittäessä aikaa kuluu erittäin kauan ja työskentely puhtaalla assemblyllä on hankalaa. Korkeamman tason ohjelmointikielet on luotu helpottamaan tätä työtä, ja kääntäjiä käytetään muuntamaan selkeämpi kieli konekielimuotoon. Konekielet ovat kuitenkin yleensä hyvin suoraviivaisia, ja käskyjen suorittamat toiminnot ovat yksinkertaisia. Tämän vuoksi assembly-ohjelmointi on helppo opetella.

Aiheesta muualla[muokkaa | muokkaa wikitekstiä]

Assemblereita[muokkaa | muokkaa wikitekstiä]